2010年3月5日 星期五

數位基本認識: Nyquist Freq

數位基本認識


何謂數位化?

簡單解說,數位化 ( Digital ) 就是以數字來描述事物。就聲音電器特性上,在當下的時間內,
給予電壓來區別記錄,有電壓提供的區塊我們付予 1 無電壓提供的區塊我們付予 0,然後再將編碼後
的數據組合起來還原真像,如此的記錄過程,就是一種數位化。
而跟數位常常一起被提到的字眼是類比 ( Analog / Analogue )。類比的意思是一種隨時間而改變的線性
記錄原則,它無法在現有的資料及設備內,獨立創造一樣的資料,它可用相似的東西去表達,
例如再運用另一組設備轉錄過來,相對的它必須遵循原有的時間過程,如此就是一種類比的紀錄方式。

類比訊號電平如何數位化?

將類比訊號數位化,根據早些年貝爾研究室 Nyquist,理論上我們只要用 40 kHz 以上的取樣率就可以完整紀錄 20 kHz 以下的訊號。我們再重提一下舊文章,就人們大概能聽取有聲音頻大概是
20 Hz ~ 20 KHz,這是何意?就音頻學,在物理上,1 Khz 的倍頻是 2 Khz,我們將其轉移到樂理上,
這個倍頻就包含一個音程,也就是那 7 個音階,亦稱為 7 均分律,若再加上 5 個半音,就是 12 均分律,
為不使轉換過程損失掉基本的頻域,我們必須高於 20 KHz,又它的倍頻就是 40 KHz,

20 Khz 的倍頻是 40 Khz,問題是為何現有的 CD 格式是 44 . 1 Khz 呢?
在 CD 發明前硬碟 ( Hard Disk ) 還很貴不是民生用品,
研發很貴,只有尋找在當時最近的資源,
拜謝那時的電影圈
1 / 24 秒 / 格的連續影像啟發,所以主要數位音訊儲存媒體的替代者是當下既有的
資源 ( 錄影帶 ),用黑白來記錄 0 與 1 的編碼
訊號。 ( 早期的影像是黑白的 )。
而格式就是每秒 30 張格,
而一張圖又可以分為 490 條掃瞄線,每一條線又可以儲存三個取樣訊號,
因此每秒有 30 ╳ 490 ╳ 3 = 44100 個取樣點。
這個成功研發的概念是由當年在貝爾研究室的 Harry Nyquist 研發出來的,為此,數位化的取樣頻率
我們就稱為 Nyquist frequency。簡單的說明如果我們欲將一類比訊號編碼記錄時,
如果每秒一格,那將會是低取樣比率,無法將過程還原,如果每秒 24 格或更多,那這個取樣比率將會
優於一格秒的記錄。
圖 1 裡的表達在說明高取樣的比率,事後才有能力供解碼還原成
之前的訊號。
低取樣的比率將無法記錄下過程,有的只是
pi pai 的數位雜音罷了。
_



圖 1,取樣的比值說明。
藉由上述的說明,數位的取樣比率格式,通常有:32、44 . 056、44 . 1、48、以及 96 KHz。
在國際上,聲音轉播放送
( on air ) 的頻寬也不過 15 Khz,因此 32 Khz 的取樣比率是如此的。

44 . 056 and 44 . 1 Khz 是供雷射 CD、音樂錄製、數位錄音使用,現在取樣比率的細調功能也都普遍
了,你可以方便的在 44 . 1 Khz
的位置,以百分比來增加或是減少比率值。
例如 Yamaha AW-4416 取樣頁面內,就有一個調整鈕來幫忙匹配這細微的取樣差。至於 48、 96 Khz
即是提供給 DVD 或是一些資料記錄方面,
尚有一些高品質的單位如 Super Audio Compact Disc
( SACD ),
目前都已發展到 192 Khz 的取樣技術了,唯獨其價前還是高高在上。

量子化 ( Quantization )

這個過程的解釋就是將一訊號波形,藉由電壓的變化,將其轉換刻錄在碟盤上。這個電壓值我們把它
量化成為兩個要素,
即二進位 ( binary digits ),或位元 bit 成為有意義的記錄。
利用此數學的方法將類比訊號的電壓轉變成為數字編碼,當輸出電壓是 off 的,我們定義為 ”0 ”,
反之我們將其定義為 “ 1 “。
Quantization 的動作就像是二進制的數學,1 0 就是兩位元,101即三位元,11010是五位元等,
所以 n 位元就等於 2n 位元字義。
所以量子化後的資料會依當下的訊號轉換類似 ----111、110、101、100、011……… 之類的資料,
在 0 與 1 的架構下,我們可以整理出:

1 個 bit 等於兩個 discrete level 及 0、1。

2個 bit等於四個discrete level 及00、01、11、10。

3個 bit等於八個discrete level 及000、001、010、011、100、101、110、111。
註,discrete level ( 分立的電平值 )

如上所釋,又想要得到好的轉換聲音訊號,量子化的位元愈長愈好,就這樣 8 bit 的量子解析是 256,
16 bit 是 65536,20 bit 是 1048576,
24 = 16777216。
會算了嗎?想再深入學習的人,可以到書電買本邏輯電路概念開始。

如下方圖 2 所示,不同的位元取樣,所得到的解析度是不一樣的,第四個圖示為16 bit 的取樣分析,
你可以看出有一個弦波的形狀了。
另外要說明的是這構成的圖像,若是在 44 . 1 Khz 時,它應該是有
44100 格的電壓解析區塊。
_



圖 2,取樣位元比值說明。
類比訊號在 Quanitzation 這些訊號電壓時,雖然取樣位元愈高,記錄就愈忠實,僅管如此,Quanitzation
後的訊號振幅結果,
多少會與真正原始的波形振幅表示,有一些誤差存在。這種情況,我們稱之為
Quanitzation noise 。
此一係值的多寡是隨著量子化的位元數增加而減少。
一樣的它也會關係到所謂的 signal – to – noise,一個類比轉換成數位的轉換元件,每增一個 bit 時,
所記錄的資料忠實度就會增加兩倍,
即與與實際波形間的誤差會變成 1 / 2,如果以分貝表示 ( dB ),
取樣忠實度的增加 2 倍,就會減少 6 dB 的噪音系數,則代表聲音強弱的動態範圍 ( Dynamic Range )
簡稱 D ,因此 16 bit 就會擁有
6 dB ╳ 16 bit = 96 dB 的動態範圍。
這相當於類比系統的 – 75 dB 左右
的噪音底層,不過就數位的領域裡,這 96 dB 噪音底層不過是一般
的條件,因此以 20 bit 為架構就可得到 120 dB 的噪音比,24 bit 會更好,達到 144 dB 之高!
註,Quanitzation noise l ( 量化噪音值 ),signal – to – noise ( 噪音底層 )。

圖 3 可以更清楚取樣位元多寡在 Quanitzation 過程的粗糙與細膩。
_



圖 3,取樣位元比值說明 2。
以上簡單的文章說明了數位的奧妙處,就它們普及化在市面上後,各種的數位格式就出現在生活裡,
在聲音領域裡,常被各位應用到的聲頻數位界面格式.,
請各位參照我另一篇文章:認識聲頻數位格式,
在此我就不再寫出。

電腦硬碟格式錄音

轉換功能成熟後,聰明的商人組合它們成為生活必須品,從早期的帶子 DAT TAPE 錄音,到今日的硬碟
HARD DISK 錄音,
線性及非線性不同的地方,凡是接觸過的人,皆有點滴… 在錄音的領域裡,
數位非線性 Digital 漸而取代類比線性 Analog
的工作方式,Hard Disk Recorder 將會取代 Tape Recorder ,
就 Audio 方面的故事,早期的硬碟錄放音模式,Hard Disk Recorder 以 Apple Macintosh Computer
做主平台。
由 Digidesign 開發的兩軌聲音工具系統 Two Track Sound Tools System,除了多次的播放,
原音不變,剪接編輯,後製,再生種種多項的優點,
改善了當初線性工作領域的瓶頸,也奠定了電腦數位
錄音的市場及
成長。

當時的電腦 CPU 處理器速度比較慢,同時能處理的工作不多,兩軌的錄放音掛在平台上,其他的資源就別
想再動用到,
後來跟隨著科技的進步,CPU 速度加快,再加上 DSP Cards 發展成功,
Recording 和 Playback 在這時候已有
多軌的模式在線上運作了。
有了金錢,有了名,Sound Tools 即改名為 Pro Tools,由於當時並不是很大眾化的產品,所以它的價格都
很高,因此有一段時間是流行原有
的類比設備參與電腦的部份功能交替作業,並不是完全交付電腦來完成
所有的事情。
當 PC 開始接觸聲音多媒體這一塊領域時,它是被嘲笑的,剛開始的我就是如此,
幾乎無法
勝任工作的,然而它夾帶著全世界使用的普及化,廉價,各項支援多,問題的發生,
很快就有人完成修正,又各項的軟體、輔助插件、儀錶
等相關的,每個人想要的。
各方面的資訊就很快能夠提供。
在目前的年代,PC 在錄音混音的市場上已是一大龍頭了,尤其是德國
Steinberg 公司所開發出來的 VST 架構,以及其相關的產品,如
Nuendo 、cubase、Wavlab,另外已讓售
給 SONY 的 Sonic Foundry,這些公司所製作出來的產品,在聲音圖形化的編輯剪接,專業領域上已經是必修的課目了,現今 Computer Audio 的市場已不再是 MAC 的天下了,反倒是 PC 漸漸的佔領這塊市場。

Hard Disk Multi Track Recorder ( 硬碟多軌記錄器 ),TASCAM MX-2424 就是業界的一個代表作品。
DAT 在記錄再生的過程裡,由於磁頭與磁帶間的接觸面有凹凸不均勻現象,或是帶子、或是磁頭清潔度
問題等,都有可能產生記錄訊號
欠缺的問題,此現象我們稱為遺訊 ( Drop out )當 DAT ( Digital Audio Tape )
的領域過後,隨之而來的是人手一台的電腦時代,包括非線性的後製處理作業全都仰賴電腦。
而且直接將訊號轉換到硬碟上就沒有此種問題的產生。Quanitzation 完後的數據是龐大的位元數據,
這是電腦看不懂的格式,因為電腦是以字元來辨別容量的,所以我們必須
將位元 bit 轉成 字元 byte,
如此才能順利的
將數位化之後的資料存入硬碟裡。

一般各位在製作數位錄音時,記錄這些轉換資料往往不清楚它們的架構,整場要配置多少空間的硬碟也
不清楚,甚至是自己攜帶的手提電腦想要側錄個兩軌訊號,都不知道可以錄多久,數不清的 mail 裡面,
問的也是這個問題,
現在這個式子寫給大家,以後就不用擔心了。

1個 bit 等於 8 byte,所以如果有一類比訊號欲存錄到硬碟裡,那麼應該 如何計算才能知道所須的硬碟空間?
假設我們以 44 . 1 Khz 取樣頻率, 16 bit 的格式來錄音,我們就會有下面的數學出現:

44 ╳ 1024 ╳ 16 ÷ 8 = 90112 byte / sec

90112 ╳ 60 = 5406720 byte / sec = 5 . 4 Mbyte / m

5 . 4 ╳ 60 = 324 Mbyte / h

這裡說明如果以 44 . 1 Khz / 16 bit 來做硬碟錄音時,那麼在每小時內,你會得到 324 MB 的資料,從這裡
不難看出,若是立體的兩軌
音樂資料,它會是 648 MB,這就是為何一張標準的 CD 音樂片子,
它們的格式會是 650 MB / 74 分鐘。當然啦,時至今日,一些 CD 的播放器材也已脫離這樣的格式來迎應
一些超時,如 700 MB / 80 分鐘的 CD 格式。唯無論你事先是採用多高的取樣,多高的位元來記錄資料,
在完成作品後,一定是全要回歸到 44 . 1 Khz / 16 bit 的格式來。

ok,這篇就寫到此,整理一下,我們從數位的開頭一直到簡單介紹應用,又知道一些事情了,
各位,加油加油。

音匠 吳榮宗



source: http://www.sounderpro.com.tw/Reviw/review.html

沒有留言:

張貼留言