聲音(音頻)
1.多媒體中的音頻處理技術(shù)
多媒體涉及到多方面的音頻處理技術(shù),如:音頻采集、語音編碼/解碼、文——語轉(zhuǎn)換、音樂合成、語音識別與理解、音頻數(shù)據(jù)傳輸、音頻——視頻同步、音頻效果與編輯等。其中數(shù)字音頻是個關(guān)鍵的概念,它指的是一個用來表示聲音強弱的數(shù)據(jù)序列,它是由模擬聲音經(jīng)抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數(shù)據(jù)寫成計算機的數(shù)據(jù)格式)后得到的。計算機數(shù)字CD、數(shù)字磁帶(DAT)中存儲的都是數(shù)字聲音。模擬——字轉(zhuǎn)換器把模擬聲音變成數(shù)字聲音;數(shù)字——模擬轉(zhuǎn)換器可以恢復(fù)出模擬來的聲音。
一般來講,實現(xiàn)計算機語音輸出有兩種方法:一是錄音/重放,二是文——語轉(zhuǎn)換。第二種方法是基于聲音合成技術(shù)的一種聲音產(chǎn)生技術(shù),它可用于語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產(chǎn)生了應(yīng)用調(diào)頻(FM)音樂合成技術(shù)和波形表(wavetable)音樂合成技術(shù)。
2.樂器數(shù)字接口MIDI的概念
現(xiàn)在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為“樂器數(shù)字接口”的縮寫出現(xiàn)的,并用它來泛指數(shù)字音樂的國際標(biāo)準(zhǔn)。由于它定義了計算機音樂程序、合成器及其他電子設(shè)備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標(biāo)準(zhǔn)的多媒體PC平臺能夠通過內(nèi)部合成器或連接到計算機MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。
至于MIDI文件,是指存放MIDI信息的標(biāo)準(zhǔn)文件格式。MIDI文件中包含音符、定時和多達16個通道的演奏定義。文件包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盤空間非常少;并且現(xiàn)裝載MIDI文件比波形文件容易的多。這樣,在設(shè)計多媒體節(jié)目時,我們可以指定什么時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時間高質(zhì)量音樂,如想在硬盤上存儲的音樂大于4分鐘,而硬盤又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數(shù)據(jù),如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或?qū)崿F(xiàn)文一語轉(zhuǎn)換,以實現(xiàn)音樂和語音的同時輸出。
3.常見的聲音文件格式
再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認識認識:
· WAVE,擴展名為WAV:該格式記錄聲音的波形,故只要采樣率高、采樣字節(jié)長、機器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質(zhì)量非常高,但這樣做的代價就是文件太大。
· MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優(yōu)點。但它也有一些致命弱點,以至于現(xiàn)在已經(jīng)逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。
· MPEG-3,擴展名MP3:現(xiàn)在最流行的聲音文件格式,因其壓縮率大,在網(wǎng)絡(luò)可視電話通信方面應(yīng)用廣泛,但和CD唱片相比,音質(zhì)不能令人非常滿意。
· Real Audio,擴展名RA:這種格式真可謂是網(wǎng)絡(luò)的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計的,因此主要目標(biāo)是壓縮比和容錯性,其次才是音質(zhì)。
· Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用于FM聲卡,但其兼容性也很差。
· CD Audio音樂CD,擴展名CDA:唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,文件長度太大。
· MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經(jīng)成為一種產(chǎn)業(yè)標(biāo)準(zhǔn),其科學(xué)性、兼容性、復(fù)雜程度等各方面當(dāng)然遠遠超過本文前面介紹的所有標(biāo)準(zhǔn)(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI制作出來的),它的General MIDI就是最常見的通行標(biāo)準(zhǔn)。作為音樂工業(yè)的數(shù)據(jù)通信標(biāo)準(zhǔn),MIDI能指揮各音樂設(shè)備的運轉(zhuǎn),而且具有統(tǒng)一的標(biāo)準(zhǔn)格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。
總之,如果有專業(yè)的音源設(shè)備,那么要聽同一首曲子的HIFI程度依次是:
原聲樂器演奏 > MIDI > CD唱片 > MOD > 所謂聲卡上的MIDI > CMF,而MP3及RA要看它的節(jié)目源是采用MIDI、CD還是MOD了。
另外,在多媒體材料中,存儲聲音信息的文件格式也是需要認識的,共有:
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種。
· WAV文件:Microsoft公司的音頻文件格式,它來源于對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一系列離散的采樣點,以不同的量化位數(shù)(8位或16位)把這些采樣點的值轉(zhuǎn)換成二進制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。Microsoft Sound System軟件Sound Finder可以轉(zhuǎn)換AIF SND和VOD文件到WAV格式。
· VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。文件頭包含一個標(biāo)識版本號和一個指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊。如聲音數(shù)據(jù)靜音標(biāo)識ASCII碼文件重復(fù)的結(jié)果重復(fù)以及終止標(biāo)志,擴展塊等。
· MIDI文件:Musical Instrument Digital Interface(樂器數(shù)字接口)的縮寫。它是由世界上主要電子樂器制造廠商建立起來的一個通信標(biāo)準(zhǔn),以規(guī)定計算機音樂程序 電子合成器和其它電子設(shè)備之間交換信息與控制信號的方法。MIDI文件中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續(xù)時間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。
· RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標(biāo)記和文本。
· PCM文件:模擬音頻信號經(jīng)模數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。在聲霸卡提供的軟件中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。
· AIF文件:Apple計算機的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。
相關(guān)推薦:
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |