標籤: 暫無標籤

MP3,全稱是Moving Picture Experts Group Audio Layer III,是當今較流行的一種數字音頻編碼和有損壓縮格式,它設計用來大幅度地降低音頻數據量,而對於大多數用戶的聽覺感受來說,重放的音質與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年,由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標準化的。

1 mp3 -基本概述

MP3MP3

MP3 就是一種音頻壓縮技術,由於這種壓縮方式的全稱叫MPEG-1 Audio Layer3,所以人們把它簡稱為MP3。MP3是利用MPEG Audio Layer 3 的技術,將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的file,換句話說,能夠在音質丟失很小的情況下把文件壓縮到更小的程度。而且還非常好的保持了原來的音質。

MP3體積小,音質高的特點,使得MP3格式幾乎成為網上音樂的代名詞。每分鐘音樂的MP3格式只有1MB左右大小,這樣每首歌的大小隻有3-4兆位元組。使用MP3播放器對MP3文件進行實時的解壓縮(解碼),這樣,高品質的MP3音樂就播放出來了。 


MP3是一個數據壓縮格式。它丟棄掉脈衝編碼調製(PCM)音頻數據中對人類聽覺不重要的數據(類似於JPEG是一個有損圖像壓縮),從而達到了小得多的文件大小。在MP3中使用了許多技術其中包括心理聲學以確定音頻的哪一部分可以丟棄。MP3音頻可以按照不同的位速進行壓縮,提供了在數據大小和聲音質量之間進行權衡的一個範圍。

根據MPEG規範的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代,儘管有許多創造和推廣其他格式的重要努力。然而,由於MP3的空前的流行,任何其他格式的成功在目前來說都是不太可能的。MP3不僅有廣泛的用戶端軟體支持,也有很多的硬體支持比如攜帶型媒體播放器(指MP3播放器)DVD和CD播放器。MP3的播放跟DVD不一樣。

2 mp3 -格式特點

mp3mp3

1、MP3是一個數據壓縮格式。
2、它丟棄掉脈衝編碼調製(PCM)音頻數據中對人類聽覺不重要的數據(類似於JPEG是一個有損圖像壓縮),從而達到了小得多的文件大小。
3、MP3音頻可以按照不同的位速進行壓縮,提供了在數據大小和聲音質量之間進行權衡的一個範圍。MP3格式使用了混合的轉換機制將時域信號轉換成頻域信號。
4、32波段多相積分濾波器(PQF)。
5、36或者12 tap 改良離散餘弦濾波器(MDCT);每個子波段大小可以在0...1和2...31之間獨立選擇。
6、MP3不僅有廣泛的用戶端軟體支持,也有很多的硬體支持比如攜帶型媒體播放器(指MP3播放器)DVD和CD播放器。

3 mp3 -發展歷程

MP3MP3

MPEG-1 Audio Layer 2編碼開始時是德國Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt(後來稱為Deutsches Zentrum für Luft- und Raumfahrt,德國太空中心)Egon Meier-Engelen管理的數字音頻廣播項目。這個項目是歐盟作為EUREKA研究項目資助的,它的名字通常稱為EU-147。

EU-147 的研究期間是1987年到1994年。到了1991年,就已經出現了兩個提案:MUSICAM(稱為Layer 2)和ASPEC(自適應頻譜感知熵編碼)。荷蘭飛利浦公司、法國CCETT和德國Institut für Rundfunktechnik提出的Musicam方法由於它的簡單、出錯時的健壯性以及在高質量壓縮時較少的計算量而被選中。

基於子帶編碼的Musicam格式是確定MPEG音頻壓縮格式(採樣率、幀結構、數據頭、每幀採樣點)的一個關鍵因素。這項技術和它的設計思路完全融合到了ISO MPEG Audio Layer I、II 以及後來的Layer III(MP3)格式的定義中。在Mussmann教授(University of Hannover)的主持下,標準的制定由Leon van de Kerkhof(Layer I)和Gerhard Stoll(Layer II)完成。

一個由荷蘭Leon Van de Kerkhof、德國Gerhard Stoll、法國Yves-François Dehery和德國Karlheinz Brandenburg 組成的工作小組吸收了Musicam和ASPEC的設計思想,並添加了他們自己的設計思想從而開發出了MP3,MP3能夠在128kbit/s達到MP2 192kbit/s 音質。


所有這些演算法最終都在1992年成為了MPEG的第一個標準組MPEG-1的一部分,並且生成了1993年公布的國際標準ISO/IEC 11172-3。MPEG音頻上的更進一步的工作最終成為了1994年制定的第二個MPEG標準組MPEG-2標準的一部分,這個標準正式的稱呼是1995年首次公布的ISO/IEC 13818-3。

MP3MP3

編碼器的壓縮效率通常由位速定義,因為壓縮率依賴於位數(:en:bit depth)和輸入信號的採樣率。然而,經常有產品使用CD參數(44.1kHz、兩個通道、每通道16位或者稱為2x16位)作為壓縮率參考,使用這個參考的壓縮率通常較高,這也說明了壓縮率對於有損壓縮存在的問題。


Karlheinz Brandenburg使用CD介質的Suzanne Vega的歌曲Tom』s Diner來評價MP3壓縮演算法。使用這首歌是因為這首歌的柔和、簡單旋律使得在回放時更容易聽到壓縮格式中的缺陷。一些人開玩笑地將Suzanne Vega稱為「MP3之母」。來自於EBU V3/SQAM參考CD的更多一些嚴肅和critical 音頻選段(glockenspiel,triangle,accordion...)被專業音頻工程師用來評價MPEG音頻格式的主觀感受質量。

MP3走向大眾

為了生成位兼容的MPEG Audio文件,ISO MPEG Audio委員會成員用C語言開發的一個稱為ISO 11172-5的參考模擬軟體。在一些非實時操作系統上它能夠演示第一款壓縮音頻基於DSP的實時硬體解碼。一些其它的MPEG Audio實時開發出來用於面向消費接收機和機頂盒的數字廣播(無線電DAB和電視DVB)。
後來,1994年7月7日Fraunhofer-Gesellschaft發布了第一個稱為l3enc的MP3編碼器。Fraunhofer開發組在1995年7月14日選定擴展名.mp3(以前擴展名是.bit)。使用第一款實時軟體MP3播放器Winplay3(1995年9月9日發布)許多人能夠在自己的個人電腦上編碼和回放MP3文件。由於當時的硬碟相對較小(如500MB),這項技術對於在計算機上存儲娛樂音樂來說是至關重要的。

MP3MP3

MP2、MP3與網際網路

1993年10月,MP2(MPEG-1 Audio Layer 2)文件在網際網路上出現,它們經常使用Xing MPEG Audio Player播放,後來又出現了Tobias Bading為Unix開發的MAPlay。MAPlay於199年2月22日首次發布,現在已經移植到微軟視窗平台上。剛開始僅有的MP2編碼器產品是Xing Encoder和CDDA2WAV,CDDA2WAV是一個將CD音軌轉換成WAV格式的CD抓取器。 IUMA通常被認為是在線音樂革命的鼻祖,IUMA是網際網路上第一個高保真音樂網站,在MP3和網路流行之前它有數千首授權的MP2錄音。


從1995年上半年開始直到整個九十年代後期,MP3開始在網際網路上蓬勃發展。MP3的流行主要得益於如Nullsoft於1997年發布的Winamp和Napster於1999年發布的Napster這樣的公司和軟體包的成功,並且它們相互促進發展。這些程序使得普通用戶很容易地播放、製作、共享和收集MP3文件。

關於MP3文件的點對點技術文件共享的爭論在最近幾年迅速蔓延—這主要是由於壓縮使得文件共享成為可能,未經壓縮的文件過於龐大難於共享。由於MP3文件通過網際網路大量傳播一些主要唱片廠商通過法律起訴Napster來保護它們的版權。

如iTunes Music Store這樣的商業在線音樂發行服務通常選擇其它或者專有的支持數字版權管理(DRM)的音樂文件格式以控制和限制數字音樂的使用。支持DRM的格式的使用是為了防止受版權保護的素材免被侵犯版權,但是大多數的保護機制都能被一些方法破解。這些方法能夠被計算機高手用來生成能夠自由複製的解鎖文件。一個顯著的例外是微軟公司的Windows Media Audio 10格式,目前它還沒有被破解。如果希望得到一個壓縮的音頻文件,這個錄製的音頻流必須進行壓縮並且帶來音質的降低。

4 mp3 -位速

MP3
MP3
位速對於MP3文件來說是可變的。總的原則是位速越高則聲音文件中包含的原始聲音信息越多,這樣回放時聲音質量也越高。在MP3編碼的早期,整個文件使用一個固定的位速。

MPEG-1 Layer 3允許使用的位速是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s,允許的採樣頻率是32、44.1和48kHz。44.1kHz是最為經常使用的速度(與CD的採樣速率相同),128kbit/s是事實上「好品質」的標準,儘管192kbit/s在對等文件共享網路上越來越受到歡迎。MPEG-2和[非正式的]MPEG-2.5包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。
可變位速(VBR)也是可能的。MP3文件的中的音頻切分成有自己不同位速的幀,這樣在文件編碼的時候就可以動態地改變位速。儘管在最初的實現中並沒有這項功能,VBR現在已經得到了廣泛的應用。這項技術使得在聲音變化大的部分使用較大的位速而在聲音變化小的部分使用較小的位速成為可能。這個方法類似於聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。一些編碼器在很大程度上依賴於這項技術。
高達640kbit/s的非標準位速可以使用LAME編碼器和自由格式來實現,但是幾乎沒有MP3播放器能夠播放這些文件。

5 mp3 -設計局限

MP3
MP3
MP3格式有一些不能僅僅通過使用更好的編碼器繞過的內在限制。一些新的壓縮格式如Vorbis和AAC不再有這些限制。
 按照技術術語,MP3有如下一些限制:
* 位速最大是320 kbit/s;
* 時間解析度相對於變化迅速的信號來說太低;
* 對於超過15.5/15.8 kHz的頻率沒有scale factor band;
* Joint stereo 是基於幀與幀完成的;
* 沒有定義編碼器/解碼器的整體時延,這就意味著gapless playback缺少一個正式的規定;
然而,即使有這些限制,一個好好的調整MP3編碼器能夠非常有競爭力地完成編碼任務。

6 mp3 -音頻編碼

MP3MP3

MPEG-1標準中沒有MP3編碼器的一個精確規範,然而與此相反,解碼演算法和文件格式卻進行了細緻的定義。人們設想編碼的實現是設計自己的適合去除原始音頻中部分信息的演算法(或者是它在頻域中的修正離散餘弦(MDCT)表示)。在編碼過程中,576個時域樣本被轉換成576個頻域樣本,如果是瞬變信號就使用192而不是576個採樣點,這是限制量化雜訊隨著隨瞬變信號短暫擴散。
這是聽覺心理學的研究領域:人類主觀聲音感知。
這樣帶來的結果就是出現了許多不同的MP3編碼器,每種生成的聲音質量都不相同。有許多它們的比較結果,這樣一個潛在用戶很容易選擇合適的編碼器。需要記住的是高位速編碼表現優秀的編碼器(如LAME這個在高位速廣泛使用的編碼器)未必在低位速的表現也同樣好。

 

 


7 mp3 -播放器解析

MP3播放器是利用數字信號處理器DSP(Digital Signal Processer)來完成處理傳輸和解碼MP3文件的任務的。DSP掌管隨身聽的數據傳輸,設備介面控制,文件解碼回放等活動。DSP能夠在非常短的時間裡完成多種處理任務,而且此過程所消耗的能量極少(這也是它適合於攜帶型播放器的一個顯著特點)。
首先將MP3歌曲文件從內存中取出並讀取存儲器上的信號→到解碼晶元對信號進行解碼→通過數模轉換器將解出來的數字信號轉換成模擬信號→再把轉換后的模擬音頻放大→低通濾波後到耳機輸出口,輸出后就是我們所聽到的音樂了。

8 mp3 -內部結構

(圖)mp3mp3

MP3播放器由液晶顯示屏、微處理器、數碼信號處理器(DSP)晶元、輸入輸出控制器、放大器和一些按鈕組成。微處理器是播放器的「大腦」,用來接受用戶選擇的播放控制,並將當前播放的歌曲信息顯示在液晶顯示屏上,然後向數據信號處理晶元發出指令,使其準確地處理音頻信號。數碼信號處理器先用解壓演算法將MP3文件解壓,接著用數模轉換器將數碼信息轉換成波形信息,然後由放大器將信號放大並送到音頻埠,最後我們就可以通過接在音頻埠的耳機聽到動聽的音樂了。

9 mp3 -優點缺點

優點
MP3的優點有許多,主要有三點:一是由於大大壓縮了文件的體積,所以相同的空間能存儲更多的信息;二是由於沒有機械元件,全部是電子元件,所以不存在防震問題,更加適合運動時欣賞音樂;三是可以隨心所欲編輯自己喜愛的歌。
缺點
有一利便有一弊,MP3 也有一些缺點。MP3音頻壓縮技術是一種失真壓縮,因為人耳只能聽到一定頻段內的聲音,而其他更高或更低頻率的聲音對人耳是沒有用處的,所以MP3 技術就把這部分聲音去掉了,從而使得文件體積大為縮小。雖然聽上去MP3音樂仍舊具有接近CD的音質,但畢竟要比CD稍遜一些。

上一篇[高橋宏]    下一篇 [加侖]

相關評論

同義詞:暫無同義詞