ADVERTISEMENT
章節目錄
第一章:記憶體動態特性與充放電機制
第三章:SDR與DDR技術與規格演進,SDR、DDR、DDR2差異性
第五章:因應GPU需求誕生的GDDR顆粒
第六章:初代GDDR2與兄弟gDDR2,稱霸市場的GDDR3
GDDR4短命的高價產品
相較於亮眼的GDDR3,GDDR4的命運可謂悲慘,不僅使用的顯卡寥寥可數,上市也僅約1年就被GDDR5取代。GDDR4是基於DDR3的架構而來,目的要取代以DDR2為基礎的GDDR3。設計方面,GDDR4的預取跟DDR3相同,皆為8bit設計,另外還有DBI(Data Bus Inversion)、Multi-Preamble等技術,有助於提升GDDR4的理論效能。
理論上高時脈的GDDR4會有比GDDR3更高的效能,但GDDR4的延遲亦高於GDDR3,這是高時脈必定帶來的產物。至於為什麼會這麼短命?一來部分廠商像是當年的Qimonda就跳過GDDR4直接研發GDDR5。再者,部分人認為,GDDR4的成本高是顯卡廠商不想使用的原因之一,理論上GDDR4等效時脈可達GDDR3的2倍,但受到製程與技術限制,出貨的GDDR4顆粒大多2~2.5GHz,後期GDDR3也靠著製程也追平這項優勢。當兩者效能相當,且GDDR3更加便宜,效能更強改進更多的GDDR5出現時,GDDR4就快速被取代。
▲GDDR4由三星獨撐大局,其餘廠商則是致力於榨乾GDDR3的潛力。但由於只有AMD少數高階卡使用,廠商投入少且NVIDIA不買單,最終面臨淘汰的命運。
GDDR4規格制定的八卦
先前有提過,AMD與NVIDIA為了GPU的發展而加入JEDEC。但在規格制定過程中,有人認為雙方的理念不同導致GDDR4最終面臨短命的下場。NVIDIA認為預取應該維持4bit,但AMD(當年是ATI)認為可以直接用8bit技術,爭執的結果是AMD陣營的規格獲勝。事情就結束了嗎?當然沒有,GDDR4這新規格誕生後因為理念不合,NVIDIA直接捨棄GDDR4,所以你在市面上看不到任何使用GDDR4顆粒的NVIDIA顯卡。一方面GDDR4瞬間失去過半的顯示卡市場,也間接讓記憶體廠商對於GDDR4感到存疑不敢貿然投產。
最終GDDR4由三星單獨支持,其餘廠商則是致力於榨乾GDDR3的潛力,這就誕生先前說過的高時脈GDDR3顆粒。GDDR4在沒有價格、製造商、顯示卡廠商等支持下,必然走向滅亡。最終GDDR4只有出現在X1950XT、HD 2900XT、HD 3870等顯卡上面,雖然橫跨3個世代,但最終難逃被GDDR3與GDDR5夾殺的命運,最後連AMD都率先搭載了GDDR5。
GDDR5超高時脈的顆粒王者
GDDR5超高的時脈是怎麼達成的?GDDR5仍使用DDR3的8bit預取技術,但DQ數量擴增為2倍。過去DDR、DDR2、DDR3以及GDDR、GDDR2、GDDR3、GDDR4都是透過DDR(Double Data Rate)技術在波形周期上端下端各傳送1次數據,官方的時脈乘以2就是等效時脈。但GDDR5有2倍的DQ,因此時脈必須乘以4才會是等效時脈。像是HD 4870使用的GDDR5顆粒時脈為900MHz,但不少人習慣視為3600MHz。
GDDR4的失敗並未讓AMD喪失嘗試的勇氣,即便GDDR4碰到效能瓶頸,加上R600(HD 2900)使用512bit記憶體控制器的表現不如預期,甚至讓後來的RV670(HD 3800)換回256bit控制器。多種情況影響下,AMD迫切需要提升效能的良方,後續的RV770(RV770 XT、RV770 PRO、RV770 LE)依然使用256bit控制器,介面頻寬不變的情況下,只能將希望放在下一代記憶體顆粒也就是GDDR5上。
從結果論來看,當時AMD率先使用GDDR5顆粒的確是明智之舉,HD 4870搭配256bit的GDDR5記憶體效能,優於GTX 260使用448bit的GDDR3,迫使GTX 260透過更新製程(65nm改55nm)、調整售價等方式應戰。
▲高階卡正反面都有配置記憶體顆粒,此為GTX TITAN。
▲GDDR5是目前高階卡使用的主流顆粒,效能優於GDDR3。
延續DBI技術、簡化佈線
其實GDDR5還有不少細節上的改進,並延續GDDR4的DBI(Data Bus Inversion)技術。DBI是GDDR4用於省電的技術,簡單來說,每1Byte的8個值當中,如果超過一半是0,那麼就會自動執行訊號轉位,把0變成1,1變成0,並透過附加的DBI來判斷是正位或是反位。為什麼這麼做呢?因為先前我們提到記憶體必須經常充電,而在0的狀態下必須要持續消耗電能(1是無電荷)。減少0的數量就能降低充電次數達到省電目的。I/O控制器亦加入新的校準技術,確保GDDR5顆粒能適應GPU記憶體控制器的需求。
此外,雖然GDDR5的針腳更多,但佈線更加精簡,過去必須透過蛇行走線平衡延遲,但GDDR5在處理時間延遲與訊號強度上更為出色,有助於PCB佈線精簡化,並減少設計成本。GDDR5身為高階顯卡的顆粒介面規格為32bit,透過2條平行的DQ,能夠讓32bit的顆粒當成16bit的顆粒。1個32bit的控制器就能控制2顆GDDR5顆粒,達到用介面換取容量的目的。雖說先前的記憶體也有類似的技術,但運作方式並不相同。
▲簡化佈線是GDDR5的特色,可看到GDDR3為了延遲而有許多蛇行走線。來源:PCPOP
▲此為GDDR3顆粒附近的蛇行走線圖,可看到許多彎折的線路。
▲GDDR5能透過減少介面頻寬的方式,來讓控制器連接更多的記憶體顆粒,達到提升容量的目的。
互相依存的2大家族
看到這裡應該能了解DDR與GDDR顆粒之間的關係,DDR是針對CPU需求而開發的記憶體,而GDDR則是更針對性地對顯示卡最佳化。前者有低時脈低延遲的特性,後者則因為海量的傳輸需求,記憶體顆粒特性為高時脈高延遲。當然,記憶體的運作原理與背景絕對不只這些內容,數10年來的記憶體故事也不會只有短短幾千字的篇幅,但礙於再不交稿就會完蛋的情況下,本篇只好著重於記憶體的基本運作、DDR、GDDR家族的特色,希望能讓各位在這篇文章中得到一些收穫。
延伸閱讀:
想讓電腦更快更順嗎?系統最佳化,深入Windows記憶體管理
再來慢慢消化
不夠過癮啊
> 看完了
> 不夠過癮啊
可惡,看樣子要加碼特別篇了(倒)
這才是電腦王啊!
> ※ 引述《PCABC》的留言:
> > 看完了
> > 不夠過癮啊
>
> 可惡,看樣子要加碼特別篇了(倒)
說好了就不反悔呀
> ※ 引述《tandee》的留言:
> > ※ 引述《PCABC》的留言:
> > > 看完了
> > > 不夠過癮啊
> >
> > 可惡,看樣子要加碼特別篇了(倒)
>
> 說好了就不反悔呀
目前在寫Tegra K1架構設計,記憶體續戰篇待有空再來處理(逃)
> ※ 引述《Grz》的留言:
> > ※ 引述《tandee》的留言:
> > > ※ 引述《PCABC》的留言:
> > > > 看完了
> > > > 不夠過癮啊
> > >
> > > 可惡,看樣子要加碼特別篇了(倒)
> >
> > 說好了就不反悔呀
>
> 目前在寫Tegra K1架構設計,記憶體續戰篇待有空再來處理(逃)
我要RAMBUS!(敲碗)
不過能不能寫一下顯示卡上頭的DDR3 跟 GDDR3 的恩怨
很多消費者還分不清這兩者是同一個還是不同東西
又會跟系統記憶體的DDR3 扯在一塊...
> 好久沒看到這種解釋文...
>
> 不過能不能寫一下顯示卡上頭的DDR3 跟 GDDR3 的恩怨
>
> 很多消費者還分不清這兩者是同一個還是不同東西
>
> 又會跟系統記憶體的DDR3 扯在一塊...
原來我寫了gDDR2跟GDDR2,卻漏了gDDR3跟GDDR3,找個時間來補上,謝謝你的建議
我推
> 是否可以新增單頁全文閱讀的模式讓讀者選擇,要換頁真的麻煩
你好,這點我們會建議技術部門,看能否增加全頁閱讀的模式,謝謝你的建議