A.jpg
聲音和頻率

為了更好地理解aptX-HD以及此音頻編解碼器如何影響音頻設備的無線流,我們必須首先了解人耳如何解釋聲音。這很重要,因為耳朵功能的原理與音頻編解碼器的功能直接相關。 



在物理學中,聲音是一種振動。這種振動採取可聽見的壓力波的形式,該壓力波可通過諸如氣體,液體或固體之類的介質傳播。聲音以縱波傳播,這意味著介質(氣體,液體或固體)中的粒子以與行波相同或相反的方向移動。當壓力增加時,這導致壓力的增加和減少,稱為壓縮;當壓力減少時,這導致稀疏化。(見圖A)

B.jpg
人類頻率

人類聲音的另一個重要因素是頻率。音頻被理解為具有普通人可以感知的頻率的周期性振動。頻率以赫茲(Hz)為單位,是頻率的SI單位。聲波的頻率決定了它的音調和音高。年輕人的頻率範圍約為20到20,000赫茲或20 kHz。(見圖B)

C.jpg
人體動態範圍

人耳能夠感知自然界產生的許多聲音,但絕不是全部。任何低於20 Hz的頻率(例如心跳為1或2 Hz的頻率)都稱為次聲。這些聲音是如此之低,以致只有大耳朵的動物(如大象)才能聽到。另一方面,任何超出人類聽力範圍的頻率都稱為超聲。許多動物使用超聲波進行導航,例如蝙蝠,鯨魚和海豚。

D.jpg
人耳

在人類中,聲音是耳朵接收這些波並被大腦感知的聲音。安靜的聲音和最大的聲音之間的範圍稱為動態範圍。從被稱為聽覺閾值的安靜者可感知的聲音(3 kHz時約為-9 dB SPL)到被稱為痛覺閾值的最大聲音(從120 dB-140 dB到),人類聽力的動態範圍約為140 dB。 SPL)。但是,無法一次感知到如此寬的動態範圍。人耳分為許多部分,每個部分都有特定的任務。張鼓鼓室,骨肌和外毛細胞均充當機械動態範圍壓縮器,以將耳朵的靈敏度調節到不同的環境水平。 



通常在音樂廳中感知到的音樂的動態範圍很少會超過80 dB,並且通常在大約40 dB的範圍內感知人的語音。

E.jpg
採樣率

為了將模擬音頻信號(音樂)轉換為數字域(CD,MP3),需要捕獲一系列快速的“快照”,這就是所謂的採樣。每個樣本都包含構成原始模擬信號的數據,其中包括信號的動態範圍和頻率。因此,採樣率就是每秒記錄的這些“快照”的數量(見圖E)。採樣率可以根據產品的目的而變化,對於CD和MP3,採樣率為44.1 kHz。這意味著每秒鐘進行一次44,100次“快照”。之所以使用此採樣率,是因為人類只能聽到高達20,000 Hz的聲音,並且將理論作為採樣的基礎表明,採樣率必須是被採樣信號頻率的兩倍。

F.jpg
字長(位深)和位速率

字長(錯誤地描述為位深度)只是用於顯示信號幅度的增量數。如果是8位系統,它將提供8個增量,因此每個單獨的樣本將分配給最接近的增量,如下圖所示(見圖F)。這稱為量化。字長越大,動態範圍越大,因為這會使每個樣本在時間上根據該樣本的確切幅度有更多的增量。 



比特率以每秒數千比特(kbps)表示,是表示一秒鐘音頻所需的數據量的量度。比特率越高,每秒的音樂數據越多。較高的比特率可產生質量更好的音頻以及較大的文件。下面給出一個計算CD質量立體聲音頻的比特率的示例。



16(位)x 44,100(採樣率)x 2(兩個立體聲通道)= 1411.2 kbps

G.jpg
數字原理

當查看16位CD(壓縮光盤)時,理論動態範圍約為96 dB,但是,由於編碼過程中應用的過程,如圖所示,16位音頻的動態範圍可以達到120 dB或更高。在圖G中,所應用的主要過程為信號增加了噪聲整形和抖動。當僅應用抖動時,添加的噪聲會分散在所有頻率上,但是當將噪聲整形添加到抖動中時,低頻中的噪聲較少,而高頻中的噪聲較大。想法是將噪聲過濾到人耳無法感知的頻率範圍。



當查看數字音頻時,20位系統可能具有120 dB的動態範圍。24位數字音頻可計算到144 dB的動態範圍。這表明20位或24位系統可以實現與人類聽力相同的動態範圍上下限。當查看數字音頻工作站時,大多數應用32位浮點系統,這又允許更高的動態範圍,並且由於這種改進的過程,動態範圍的損失不再是數字音頻處理中的關注點。 



提出的最後一點很重要,因為當模擬信號(音樂)首次記錄到數字設備(PC,DAW)時,低位系統通常無法代表完整的動態範圍。反過來,錄音的最終數字版本將在安靜的聲音和最大的聲音之間具有較小的範圍,這可能會影響最終聽眾的收聽質量。

H.jpg
有損/無損壓縮

為了在低功率移動設備(手機,平板電腦,筆記本電腦)上存儲大量數字音頻文件(MP3),必須減小原始音頻文件的大小。這是必需的,否則您的設備上不會收到很多歌曲。



有兩種方法可以實現此目的,它們被稱為無損壓縮和有損壓縮。 



無損壓縮(WAV,FLAC)允許在再次解壓縮文件時恢復所有原始數據,同時大大減小了文件大小。 



有損壓縮(MP3,AAC)的工作原理有所不同,因為有損壓縮最終消除了原始文件中所有“不必要”的信息,從而使壓縮後的信息變得更小。這通過應用基於我們的大腦如何解釋聲音並消除諧波和其他頻率內容的技術來實現,而這些頻率和其他頻率內容不會被我們的大腦感知。有損技術可以將原始文件大小減小到十分之一,同時保持幾乎相同的文件。

I_Y.jpg
aptX-HD解釋

下面說明aptX-HD的一些主要功能,以及與其他無損編解碼器的區別。 



aptX-HD(也稱為aptX無損),具有576 kbps的比特率。這允許高達48 kHz採樣率的高清音頻和高達24位的字長(位深)。因此,提供了足夠的細節來表示數字形式的模擬信號。即使編解碼器的名稱表明它是無損的,但從技術上講它仍然是有損的。這是因為它對無法應用無損編碼的音頻部分使用“近無損”編碼。由於只有有限的空間可以傳輸數字信號,因此在這些特殊情況下應用了“近乎無損”編碼。這被稱為帶寬,並且由於帶寬是有限大小,因此始終應用完全無損編碼將需要更大的帶寬來傳輸信息。

I_P.jpg
aptX-HD解釋

aptX-HD的另一個適應性功能是編碼延遲。編碼等待時間只是將信息從模擬信號轉換為數字信號所花費的延遲。對於48 kHz採樣音頻,aptX-HD的編碼延遲可以降低至1 ms,這取決於編解碼器的其他設置。 

與其他無損壓縮格式相比,aptX-HD的性能非常好,只要將編碼延遲保持在最大5 ms或更短的時間內即可。這使得aptX-HD特別適用於對延遲敏感的交互式音頻應用,例如無線耳機。當音頻信息從用戶的移動設備(移動設備,平板電腦,PC)流向輸出(無線耳機)時,這一點尤其重要。低延遲意味著用戶在按下播放和從耳機接收音頻之間的延遲方面不會遇到任何問題。不管是小的MP3(有損)文件還是稍大的WAV(無損)文件。



I_B.jpg
aptX-HD解釋

與知名的有損編解碼器(例如MP3和AAC)相比,aptX-HD和許多其他無損編解碼器需要的計算機處理能力更低。aptX-HD通過使用可能的最簡單的編碼方法來實現這種低處理能力,同時平衡了其他工作因素,例如編碼延遲和壓縮級別。這對於無線耳機尤為重要,因為這意味著設備的電池壽命不會受到太大影響。因此,電池的使用壽命將比其他不使用aptX-HD芯片的相同尺寸電池的無線耳機更長。根據aptX-HD中應用的設置,它可以在現代處理器上僅使用10 MIPS(每秒數百萬條指令)來編碼48 kHz 16位立體聲流。另一端的解碼器在同一平台上僅使用6 MIPS, 



諸如元數據和同步數據之類的附加信息可以以可變速率嵌入aptX-HD。由於數據的嵌入速率是可變的,因此在數據損壞或丟失的情況下,它可以重新同步,以保持較高的QoS(服務質量)。根據解碼過程中應用的設置,重新同步可能會在1-2毫秒內發生。