ADVERTISEMENT
先前我們介紹了不同數位音訊的儲存格式,裡面有些微提到一些脈衝編碼調變(Pulse-code modulation,PCM)的基礎概念,但除了PCM或更精準地說是線性脈衝編碼調變(Linear pulse-code modulation,LPCM)之外,近期還有一個非常受關注的DSD(Direct Stream Digital)編碼格式。現在市面上的高階播放器,大多打著能支援DSD解碼來當作一個賣點,但是到底甚麼是DSD編碼格式?是否真的有如同廠商宣稱提供更優良的音質?這就是本篇文章所要和大家一起探討的,底下就讓筆者來簡單的介紹一下DSD歷史。
Direct Stream Digital的歷史
事實上DSD的起源已經非常久,早在60年代就已經有利用脈衝密度調變〈Pulse-density modulation,PDM〉編碼,將音頻訊號記錄在數位媒體上,正確來說應該是由PDM一個特殊分支 -脈衝寬度調變(Pulse Width Modulation,PWM)來實現,這種編碼方式目前已經完全被PDM格式所取代。
目前常見的DSD編碼就是基於PDM規範,這個音樂編碼格式的標準規範在1999年發表,是由當時領導音樂儲存格式的巨頭Sony和Philips合作開發,至於為何制定DSD規範的原因有些複雜。主要是因為那時候由Sony和Philips所制定的CD 〈Compact Disc〉規範專利快要過期,在即將失去由CD專利帶來的大量收益情況下,Sony和Philips決定再次聯手打造下一代的音樂儲存規格Super Audio Compact Disc 〈SACD〉,所以DSD的出現絕大部分是因為商業考量。
在儲存編碼上,SACD使用和CD常見PCM編碼完全不同的音訊格式,採用單位元的DSD編碼。Sony花下重金聘請當時最頂尖的兩位聲音工程師Ed Meitner〈現任職於EMM Labs〉和Andreas Koch 〈現任職於Playback Design〉來制定SACD規範,並且在初期免費開放給大多數知名錄音室使用,這成為DSD音訊儲存格式第一次大規模被使用在商業活動上。
▲Direct Stream Digital標誌。
超級音頻光碟〈SACD〉的起源
講到DSD自然必須介紹一下SACD,SACD取樣頻率高達2822.4kHz,是一般CD取樣頻率44.1kHz的64倍,而且理論上具有能夠再生100kHz以上頻率範圍的能力。此外由於SACD使用DSD的脈衝編碼,因此省去位元轉換的過程,同時降低數位濾波可能產生失真和雜訊的問題。
雖然這一切都讓SACD聽起來非常的美好,但SACD在推廣的路途上卻是相當艱難,因為當Sony和Philips決定用專利屏障再次壟斷音訊儲存格式時,其他音樂製作公司和硬體生產商卻看上了正蓬勃發展的DVD光碟,並且希望利用這個容量更大的儲存媒介來發行高品質音樂光碟,就此開啟了新世代音樂儲存媒介規格的戰火。
Super Audio CD和傳統CD音樂光碟規格比較
Super Audio CD | CD-DA | |
編碼格式 | Direct Stream Digital | Linear PCM |
碟片容量 | 4.70GB- Single Layer [DVD-5] 8.54GB- Dual Layer [DVD-9] |
Max. 780MB |
讀取機制 | 650nm半導體雷射 | 780nm半導體雷射 |
聲道數 | 最高支援5.1聲道 | 雙聲道 |
響應頻率範圍 | 0~100kHz 〈max〉 | 5~20kHz |
動態範圍 | 在可聆聽頻率範圍內〈0 - 20kHz〉,最高達120db | 96db |
取樣頻率〈雙聲道〉 | 每秒2,822,400次 | 每秒44,100次 |
取樣深度〈量化〉 | 1bit | 16bit |
最高資料流量〈雙聲道〉 | 5.64Mbps | 1.4Mbps |
規格制定公司 | Sony、Philips | Sony、Philips |
高品質音樂儲存規格之爭
DVD-Audio規格很迅速地在SACD出現的隔一年後正式上路,使用和CD相同的LPCM編碼,並且可以儲存高達192kHz/24bit雙聲道的高品質音樂。DVD-Audio在音樂製作上和傳統的CD音樂並沒有太大區別,由於多數音樂製作公司都歷經過CD格式的洗禮,因此剛開始大部分音樂製作公司,偏向選擇技術上更加成熟的DVD-Audio規格,當然也有一部分理由是可以擺脫Sony和Philips的專利束縛。
想當然,Sony和Philips為了捍衛自家格式和利益自然會做出反擊,Sony和Philips藉由自己在硬體製造上的優勢,拉攏大多數DVD播放器製造商,讓後續生產的DVD播放器無法相容DVD-Audio。這個作法嚴重的打擊DVD-Audio陣營,雖然DVD-Audio陣營有不少大型公司支持,但是其內部意見卻是相當分歧。由於每個成員都怕被另一個規範所束縛,這為DVD-Audio推廣之路種下了失敗的種子。
另外更令內部成員驚恐的是,在那音樂盜版猖獗的年代,DVD加密法很快地就被駭客所破解,每個音樂製作公司都害怕DVD-Audio會重演CD的盜版局面,因而都裹足不前。第一份正式DVD-Audio音樂光碟,居然是由一個發燒友,在缺乏良好錄音設備的小型研究室錄製。
在DVD-Audio陣營內部互相猜忌的情況下,Sony乘勝追擊的許諾SACD將永遠不能被電腦所播放,這幾個舉動成功穩固住SACD作為新一代音樂光碟的地位,並且也解決了雙方陣營長久以來懼怕盜版的疑慮。
▲SACD標誌及SACD的種類。由左至右分別為 〈1〉單層SACD〈4.7 GB〉 〈2〉雙層SACD〈8.5 GB〉 〈3〉混和型SACD〈4.7 GB〉 〈圖片來源:網路資源〉。
SACD的殞落
經過上面一大串折騰和較勁之後,Sony和Philips陣營開始自信滿滿地宣傳和推廣多聲道格式SACD,並且宣稱未來是高品質多聲道音樂的年代,而且也漸漸獲得多數音樂製作公司的認同。眼看著儲存格式大戰就要分出勝負的時候,Apple的iPod迅雷不及掩耳上市了,爾後幾年將線上數位音樂下載量,更提升到了一個驚人的程度。
面對Apple所掀起的線上數位音樂潮流,Sony選擇繼續維持SACD的生產和發行,並且在2003年規劃出同時擁有傳統CD層和SACD層的混和型SACD,期望在實體音樂光碟銷售上有所突破。但是這很快地就碰上SACD播放器銷售不佳的問題,因為當年的SACD播放器價格大多落在5,000元美金以上〈約新台幣15萬〉,非常少消費者願意購買昂貴,而且只能播放音樂的SACD播放器,因此讓SACD的銷售受到直接的影響。
再加上幾年後,Wavelength Audio發布了基於電腦播放的非同步USB DAC,這使得利用電腦播放高品質音訊檔案變得更加容易。爾後又隨著全世界網路速度的提升,和線上音樂的流行,出門購買音樂光碟漸漸的不再是獲得高品質音樂唯一來源,SACD就此成為只有少部分音樂愛好者的選擇。
▲混和型SACD結構圖和讀取機制,混和型SACD具有一層4.7GB容量的DSD層〈上層〉,同時還包含一個符合PCM紅皮書的CD音樂層〈下層〉,這使得它能夠相容於傳統的CD播放器。〈圖片來源:Wikipedia〉
2006年,在體認到SACD幾乎已經不可能成功的情況下,Sony做了一個策略上的大轉變,推翻之前SACD將不會被電腦播放的承諾。Sony推出以SACD為基礎的DSD-Disc,這個格式的SACD將舊有物理防拷貝保護層移除,使得電腦也能夠讀取這類型光碟片。
但是由於已經失去市佔率,DSD-Disc在完全沒有推出過任何商業音樂光碟下就被拋棄,從2009年後就已經沒有大型商業音樂製作商,使用SACD當做音樂儲存媒介。雖然到這邊,由Sony和Philips主導的SACD已經完全潰敗,但也為後續的DSD格式音樂打開了另一扇大門。
DSD音樂播放原理
上面看完了DSD音樂格式的歷史資訊,這邊筆者想先來介紹一下DSD到底和PCM有甚麼不同,首先我們就從介紹DSD音訊編碼開始。DSD編碼DSD則使用不同於以往PCM邏輯來記錄音訊,DSD訊號是以ΔΣ調變後的PDM編碼形式儲存在儲存媒介上,DSD的內部記錄的是一個連續時間的單一位元序列,以固定的時間間隔來記錄,在標準的SACD規格下每個取樣間隔是1/2822400秒,取樣頻率為CD規格 〈44.1kHz〉 的64倍之高。
DSD每一次取樣會比對本次取樣和上一個樣本值的變動,接下來使用0和1來記錄振幅的變化,0代表比上一個訊號值來得低,1代表比上一個訊號值來格高,所以每一個取樣的訊號是和前一個訊號的相對值。DSD藉由非常高的取樣頻率,將以往量化不精準所造成的失真,下降到一個位元以內的誤差。
▲DSD音訊PDM編碼示意圖,DSD在每1/2822400秒記錄下一個單位元的資料,每一次記錄的資料是和前一個資料的相對值。〈圖片來源:Wikipedia〉
為了確保每一位讀者,都能夠輕易理解等一下的DSD和PCM比較,在這邊快速地介紹一下PCM編碼。PCM編碼主要包含取樣〈Sampling〉、量化〈Quantization〉、編碼〈Coding〉三個過程,如下圖上半部所示,PCM也是在一個固定的間隔時間內〈如CD是1/44100秒〉記錄下原始類比訊號的振幅。
但和DSD不同的是,PCM記錄的是一個絕對值而非DSD的相對值,每一個不同的振幅強弱都有其代表的數值。然後再將記錄下來的數值轉換成離散時間訊號,最後再依據PCM規範給予一個編碼就是常見的LPCM格式數位音訊。簡單來說,PCM編碼就是在連續的時間〈X軸〉座標下,記錄當時的振幅〈Y軸〉大小。
▲Linear-PCM編碼示意圖,在固定時間間隔下〈圖中為1/44100秒〉,記錄當下的振幅大小的絕對值。〈圖片來源:Wikipedia〉
DSD音樂播放
DSD音樂的記錄和播放流程,相較於傳統PCM編碼來得簡化許多,由於目前市面上主流是使用基於單位元的類比數位轉換器(analog-to-digital converter,ADC),來進行音樂錄製。所以如果將錄下來的聲音直接使用DSD格式儲存的話,在播放時只需要在輸出端,經過一個開關電容網路構成的低通濾波器,來還原成類比訊號即可。
整個流程相較於傳統的PCM處理,省去了在錄音端單位元轉多位元的過程,和在播放端必須經由超取樣和ΔΣ調變成PDM訊號的手續。這使得DSD具有非常好的先天優勢,並且理論上能夠在硬體端節省下多餘的處理元件,也間接地降低處理過程所產生的失真。
SACD較早時期採用1bit轉換技術造成的高頻抖動〈dithering〉與諧波〈Idle Tone〉等問題,目前的DAC晶片為了因應1bit解碼缺點,大多使用多位元〈例如:6 bit,64階〉的ΔΣ調變。此種調變混合1bit PDM和PCM的優點,在低電位輸出時直接調整輸出脈衝電壓為低電壓,可以讓後續的低通濾波電路設計問題簡化不少。在理論上看起來是如此的完美,但是人算不如天算,完美的事情永遠只在理想狀態下發生,筆者將在後面的章節和各位討論DSD所需要面對的問題和優勢。
▲〈上圖〉PCM音訊的錄製和播放流程簡圖,總共歷經兩次超取樣處裡和兩次位元數轉換,〈下圖〉理想狀態下DSD音樂錄製和播放流程簡圖,過程中無須經過超取樣和位元數轉換。
下一頁:DSD和PCM編碼優缺點比較
如果能舉例比喻,
或許可能有較高易讀性。