HD Audio為TWS耳機最佳化音訊播放

作者 : Thomas Miller,Knowles Corp.工程研究員

為了提供HD音訊,需要升級交付鏈中的所有階段。音樂串流媒體服務、手機和藍牙轉碼器如今已能提供比以往更高的傳真度。現在是TWS耳機設計人員充份利用這些變化來滿足消費者需求的時候了!

隨著消費者對於高解析(HD)音訊的興趣不斷攀升,具有先進功能的HD真無線(True Wireless Stereo;TWS)藍牙耳機之巨大需求正達到頂峰。本文介紹HD音樂傳輸背後的技術,以及音訊設計人員如何滿足日益成長的需求。

業界專家注意到對於HD音訊無線耳機的需求正穩步增加。相關研究也顯示,隨著各年齡層的人們(包括與年齡相關聽力下降的人)尋求全HD音訊體驗,為了彌合音訊與聽覺之間的差距,對聽力個性化的需求正日益增加。這些趨勢正推動音樂傳輸鏈上各個階段HD音訊支援的發展。

HD音訊的演變

高解析度音訊(或HD音訊)這一詞並沒有嚴格的技術定義。它通常用來描述相對於早期所用音訊系統,支援更高資料速率的這類裝置。該術語最初用來描述可支援比光碟(CD)標準更高資料速率的數位音訊系統,包括替代磁片格式,以及後來包含數位音訊記錄檔。它也被應用於音訊串流,最近並被應用於能夠提供比典型音訊品質更好的無線耳機。

音訊錄製和傳送方面的改進,提高了行動聽眾可用的資料速率。無線耳機由於藍牙的限制而落後。但是,較新的藍牙轉碼器使無線耳機能夠提供HD音訊。這對包括驅動器在內的音訊硬體提出了新的要求。本文將解釋與HD音訊相關的技術,描述從音源到耳機的音訊鏈進展,以及如何使用平衡電樞(BA)高音揚聲器和動態低音揚聲器並結合主動降噪(ANC)技術、減少堵耳和聽力個性化來提供HD音訊品質的聲音。

技術背景

數位音訊格式最簡單的描述方式是取樣速率和位元深度(圖1)。數位音訊透過及時快速地採樣訊號振幅來表示類比聲音。它會對每個樣本的振幅進行測量並將其儲存為二進位數字。每秒的樣本數就是取樣速率。用來描述振幅的二進位數字長度也就是位元深度。

取樣速率

Sample rate

1:數位音訊中的取樣速率和位元深度。

歸功於奈奎斯特(Nyquist)——以及香農(Shannon)和惠特克(Whittaker)的資訊理論指出,必須每個週期至少對正弦波進行兩次採樣,才能準確擷取其資訊。否則,重配置的輸出就會是錯誤頻率的混疊,如2a2b所示。混疊是以「奈奎斯特頻率」(取樣速率的1/2)為軸的頻域鏡像。

對於音樂,取樣速率必須至少要是待再現最高頻率的2倍。因此,如果要表示的最大音訊頻率為20kHz,那麼就需要40kHz的取樣速率。這需要在ADC使用非常陡峭的20kHz低通濾波器。任何20kHz以上的音訊通過該濾波器,在轉換回類比時都會被重建為可聽見的混疊,因此就會降低音樂的傳真度。因為沒有一個濾波器是完美的,所以在現實世界的實作中,就需要在待表示的最高頻率和採樣限制之間提供一定的裕量。在光碟格式中,待採樣的音訊經過低通濾波器濾波到20kHz。取樣速率設置為44.1kHz,略高於40kHz的理論極限,從而提供濾波器裕量。

Alias in time & frequency domains

2a2b:時域和頻域中的混疊。

位元深度

用於描述樣本的字元長度是位元深度,它決定了每個樣本被數位化的準確程度。想像一下,把一個人的身高用四捨五入描述成一位數有多高?這樣,可以說某個人有2公尺(m)高。如果能再加一位數會更好,這樣就可以將某個人的身高清楚地描述為2.1m或2.2m高。這仍然有點粗糙,但可以繼續添加數位,直到提供足夠的解析度。

數位音訊也是如此(3)。每次在二進位字中使用一個附加位元,就可以用兩倍數量的值來描述其振幅,進而就可以將誤差減少兩倍。雖然有人會直觀地認為四捨五入會導致失真,但事實證明,只要施加一點點被稱為抖動的雜訊,可以將誤差(量化誤差)從失真轉換為雜訊。因此,一個好的錄音系統不會有失真,而且每增加1位元深度,背景雜訊就會下降6dB。最響亮的未失真聲音與背景雜訊之間的比率為6×位元深度。

由於數位系統是建立在8位元的倍數之上的,因此數位音訊使用8位元的倍數來表示其字長。非常早期的電腦音訊僅使用8位元。使背景雜訊僅比最響亮的音樂低48dB並不是很實用。光碟支援16位元深度,可提供96dB的訊號雜訊比(SNR)。這就涵蓋了一個非常有用的範圍。如果將播放音量設置為合理的水準,那麼歌曲之間剩餘的嘶嘶聲就會低於收聽環境中的背景聲音。隨著音量的提高,歌曲之間或安靜的段落中就可能會出現一些可聽見的嘶嘶聲。因此,就有理由使用更高的位元深度來減少總系統雜訊的這個分量。

Effect of increasing sample rate and bit depth

3:增加取樣速率和位元深度的影響。

壓縮

光碟的組合位元速率為:16位元/樣本∙44,100樣本/秒∙2個通道=1,411千位元/秒(kbps)。這種資料速率太大而無法用於早期的數位音訊播放機。下載歌曲花費的時間太長而可用的記憶體有限。為了解決這個問題,業界開發了壓縮方法。模式辨識可用於對資料流程中1和0的模式提供更簡潔的描述。這就是在電腦中壓縮資料檔案的想法。有些檔案可以被壓縮到小於原始大小的1/10,然後在以後被無損耗地恢復。

使用這些方法無法大量壓縮音樂檔。使用線性預測演算法,有助於獲得一些改進。然而,壓縮比仍然很少超過2:1。由於沒有資料遺失,它們被稱為無損編碼器。兩個普遍的例子是FLAC和Apple無失真壓縮。

為了進一步降低資料速率,可以使用人類聽覺的心理聲學模型來最大限度地降低所丟棄資料的可聽度。用一種聲音隱音被人類感知是很常見的(參見4)。因此,透過以較低的速率對這些隱藏的聲音進行編碼或將其完全丟棄來降低整體資料速率。雖然心理聲學壓縮方法得到了改進,但即使是藏另一種聲設計最好的編碼器仍然會導致一些可聽見的偽影。較低的壓縮率能以更大的檔案和更高的資料速率為代價提供更少、更溫和的聲音偽影。這就是向HD音訊串流進步背後的科學,從而實現以更高速度傳輸音樂的能力。

擴展頻寬

「HD音訊」(HD Audio)和「高解析度音訊」(High resolution audio)二者經常作為同義詞使用,但在此可能導致混淆。「HD音訊」用於描述具有比傳統所用資料速率更高資料速率的任何音訊。日本音訊協會(Japan Audio Society;JAS)授權將「HD音訊」標誌用於滿足特定要求的硬體,包括能夠再現高達40kHz的音訊。

Loud sound masking perception of quieter sounds

4:響亮聲音遮蔽了對於具有相似頻率的較安靜聲音之感知。

HD音訊是增加取樣速率、位元深度和降低壓縮率的任意組合結果。如果將取樣速率增加到超過44.1kHz,那麼數位化音訊就會更接近原始訊號,進而有助於在整個傳輸鏈中保持傳真度,並可能將頻寬擴展到20kHz以上。並非所有HD音訊格式和設備都具有超過20kHz的頻寬,但有些有,尤其是那些瞄準JAS認證的設備。

音樂傳播鏈

為了讓聽眾享受到HD音訊,整個過程中的每一步都必須具有足夠的品質。其中包括原始歌曲準備過程、下載或串流媒體服務、播放系統、耳機連接以及耳機驅動器。

錄製和交付

音樂錄音設備在市面上廣泛存在,它能以各種取樣速率和位元深度進行儲存,其中許多超過了光碟規格。一旦音樂被記錄下來,就必須將它交付給用戶。檔案下載服務支援HD音訊已有一段時間了。最近,大多數流行的串流媒體服務宣佈或已經將無損CD品質作為基準提供,在其資料庫中也更具有高位元速率HD的子集,通常還不收取額外費用。

音樂播放硬體

今天,人們可以使用各種設備(包括專用音樂播放機、手機和PC等)收聽已下載或透過資料串流的音訊。這些設備中已廣泛提供HD音訊播放。支援HD音訊的額外成本相對較低,通常支援高達192kHz的取樣速率和高達32位元的字長。在某些情況下,這些設備的類比耳機輸出(如果有的話)被限制在20kHz,並且通常不具有超過16位元的雜訊性能。但是,在這些情況下,可以將外部DAC插入數位埠以獲得更高的性能。

耳機轉碼器

音樂傳播鏈的最後一步是耳機。在無線耳機中,一個關鍵的限制因素是藍牙無線電鏈路。藍牙轉碼器在傳輸到耳機之前會降低資料速率。為了滿足無線耳機和TWS中對優質音訊日益成長的需求,業界推出了具有更高資料速率的轉碼器(1)。在設計耳機時,即使不是完全無損,這些較新的轉碼器也可以提供更高傳真度的收聽體驗。更進一步,高通(Qualcomm)甚至還宣佈打算支援基於藍牙的無損傳輸CD品質音訊。

有些新的HD藍牙轉碼器還支持擴展頻寬,讓耳機可以再現20kHz以上的頻率。5顯示市售TWS耳機的響應曲線測量結果。高達40kHz的重要輸出在其上可見。

Bluetooth codecs

1CD標準和常用的藍牙轉碼器。

Response Vs Codec

5Edifier Neobuds Pro TWS藍牙耳機頻寬比較。

HD TWS耳機音訊設計

購買HD TWS耳機的客戶對音訊的期望值非常高。由於整體功能集和驅動系統可用的空間有限,聲學設計在TWS耳機中尤其具有挑戰性。TWS耳機必須舒適地貼合耳朵,並且必須越來越多地提供ANC和其他先進功能。這對於聲學設計人員帶來了獨特的挑戰。

ANC和HD音訊的需求之間如何互動尤為重要。為了在嘈雜的環境中提供有效的ANC,驅動器必須支援低失真的高低音輸出。用於減少堵耳的漏音或半開放式設計,對低音輸出提出了更高的要求。同時,HD音訊播放需要將高音輸出擴展至20kHz甚至更高,尤其是在尋求JAS Hi-Res Audio Wireless認證的情況下。隨著揚聲器尺寸的減小,使用單個動態揚聲器同時滿足這兩個要求變得越來越困難。然而,現代TWS設計卻要實現小巧、舒適的外形。

Knowles ref. design hybrid

6Knowles混合參考設計的頻率響應。

BA高音揚聲器還支援以低功耗驅動高音增益,這使其成為提供聽覺個性化的耳機理想選擇。它們的密封、封閉式設計限制了啟用個性化時對麥克風的聲學回饋可能性。為了滿足這些看似矛盾的需求,許多耳機使用單獨的動態低音揚聲器和BA高音揚聲器來取代單個全頻驅動器(6)。這種混合配置提供了更平滑、更擴展的高頻響應,同時減少了對可能增加功耗和減少動態裕量的電子均衡的需求。低音揚聲器設計專注於為音樂、ANC和減少堵耳提供強勁的低音,而BA高音揚聲器則經過最佳化,可再現清晰獨特的高音以支援HD播放。

這樣的設計還為驅動器的佈置提供了更大的自由度。它可以將低音揚聲器移動到與耳塞不太直接對齊的位置或角度,同時仍將BA高音揚聲器保持在開口附近,從而最大限度地減少高音揚聲器和耳塞之間所滯留的空氣慣性。使耳機整體形狀更加靈活,就可以實現最大的高音延伸,這樣就能在不損失高頻性能的情況下提高使用者舒適度。

使用BA高音揚聲器,可以提供多種工具來調整高頻響應。對高音揚聲器開口附近的聲學特徵進行整形,有助於進一步細化高頻輸出。對分頻器進行調整,就可以平滑混合低音揚聲器和高音揚聲器訊號,還能選擇更高或更低的線圈阻抗以調整高音揚聲器的靈敏度,從而更好地匹配低音揚聲器。最終的整形則可以透過DSP調諧來完成。BA高音揚聲器的高擴展輸出最大限度地減少了增加高音增益以產生所需基線響應的需要。

Treble response of Knowles RAN tweeter

7Knowles RAN高音揚聲器的高音響應與典型的8mm動圈揚聲器比較。高音揚聲器提供的額外動態裕量減少了增加高音增益的需要,尤其是在個性化音訊時。

每個驅動器都可以由自己的放大器驅動,從而在對響應整形方面更加靈活。英國Bowers & Wilkins (B&W)的PI7以及Edifier Neobuds Pro是兩個使用獨立放大器和主動分頻器的TWS耳機案例。

此外,還可以使用高音揚聲器提供遠高於20kHz的響應。7比較Knowles BA高音揚聲器模型RAN的高音輸出,以及典型的8mm動態揚聲器。BA高音揚聲器提供了HD音訊所需更高的高音輸出和擴展,包括支援聽覺個性化或聽覺增強的能力。

總結

消費者對TWS耳塞的HD音訊品質要求越來越高。為聽眾提供HD音訊,需要升級交付鏈中的所有階段。音樂串流媒體服務、手機和藍牙轉碼器如今已能提供比以往更高的傳真度。現在是TWS耳機設計人員充份利用這些變化來滿足消費者需求的時候了。為此,還必須密切關注驅動系統。帶有動態低音揚聲器和BA高音揚聲器的混合驅動器,可說是HD音訊TWS耳機的理想解決方案。

(參考原文:HD Audio’s Big Break: Optimizing Audio Delivery and Playback in TWS Earphones,by Thomas Miller)

本文同步刊登於EDN Taiwan 2022年10月號雜誌

活動簡介

人工智慧(AI)無所不在。這一波AI浪潮正重塑並徹底改變科技產業甚至整個世界的未來。如何有效利用AI協助設計與開發?如何透過AI從設計、製造到生產創造增強的體驗?如何以AI作為轉型與變革的力量?打造綠色永續未來?AI面對的風險和影響又是什麼?

AI⁺ 技術論壇聚焦人工智慧/機器學習(AI/ML)技術,涵蓋從雲端到邊緣、從硬體到軟體、從演算法到架構的AI/ML技術相關基礎設施之設計、應用與部署,協助您全面掌握AI最新技術趨勢與創新,接軌AI生態系佈局,讓機器學習更快速、更經濟、更聰明也更有效率。

贊助廠商

加入LINE@,最新消息一手掌握!

發表評論