ADVERTISEMENT
不論是軟體或硬體,革命性新架構都需要時間磨合。AMD 的 Bulldozer(推土機)也有類似的問題,由於採用新設計的 CMT(Clustered Multi Threading,叢集多執行緒)架構,使得 Windows 7「認不出來這個架構」。現在微軟針對 Bulldozer 提供更新檔,小編實測到底效能增加了多少!
快速目錄:
- 推土機使用CMT(叢集多執行緒)架構,兼有單晶片多核心、同步多執行緒的優點
- 免費 Windows 7 更新檔,如何發揮推土機效能
- FX 處理器更新檔實測,到底效能增加了多少?
不論是軟體或硬體,革命性新架構都需要時間磨合。Intel在2008年首度推出Nehalem架構Core i7,雖然理論效能遠高於當代處理器,但是實測中也發現不少軟體或遊戲的效能「出不來」。
Win 7 認不出推土機架構,效能跑不出來
推土機推不動
AMD 的 Bulldozer(推土機)也有類似的問題,由於採用新設計的CMT(Clustered Multi Threading,叢集多執行緒)架構,使得Windows 7等作業系統「認不出來這個架構」。現在微軟針對Bulldozer提供KB2646060以及KB2645594更新檔,讓FX處理器不再跛腳。
CMP架構:核心量取勝
為什麼CMT架構會讓處理器效率不彰?得先從處理器的架構談起會比較有概念。先前處理器架構大致上有2個派別,分別為CMP(Chip MultiProcessor,單晶片多核心)與SMT(Simultaneous Multithreading,同步多執行緒)架構。
前者就是AMD拿手的多核心架構,透過增加核心數量來堆疊處理器效能,現在六核心、八核心,或是伺服器市場的十二核處理器都是代表。優點是架構簡單、堆疊容易,效能提升是顯而易見的。但缺點就是電晶體數量較多,成本比SMT更高,且核心數量到達一定程度後,效能與成本效益越會越來低。
SMT架構:成本低、效益高
SMT架構則是Intel使用的HT(Hyper-Threading,超執行緒)技術,它能讓1個核心具備多個執行緒,並且能共享資源,硬體上需要增加的成本比CMP架構還低。Intel最早在Pentium 4時代加入HT技術,後期隨著多核心架構的優勢而消失。到了Nehalem時期才再度回歸,目前Sandy Bridge系列Core i3與Core i7多款產品都有支援HT技術。
CMT:模組化多核心架構
Bulldozer使用的CMT架構不同於CMP或SMT,當初AMD在設計時希望能將核心與執行緒的效益最大化。以往CMP與SMT各有其優缺點,CMP效率比SMT高,但SMT成本又比CMP低。取其優點後,產生的就是CMT架構。
截長補短的CMT
CMT是Clustered Multi Threading的簡寫,根據字面上的意思是叢集多執行緒。若講的白話一些,可以把它當成模組化多核心。Bulldozer一改過去的核心架構,處理器由模組(Module)構成,每個模組內有2個獨立卻能共享部分資源的實體核心。透過模組化設計,讓每個模組可執行2個執行緒,可節省硬體成本,又能強化效能。
多核心的新定義
八核心的FX-8150處理器內有4個模組,每個雙核心模組有2個整數單元(Integer Unit),並1個共享的浮點運算單元(Flex Floating Point Unit,簡稱FPU),整數單元內還有調度器(Scheduler)。由於具備調度器,因此Bulldozer的模組可執行2個執行緒,這就是AMD定義的CMT架構。
傳統核心設計上,處理器每個核心都有獨立的整數運算單元,以及浮點運算單元。但Bulldozer架構的核心在傳統的定義中並不算完整的核心,因此也有人說FX-8150這種CMT架構處理器,只能算是四核心八執行緒處理器。
▲1個CMT雙核心組的規模,大約是2個單核心的75%,理論吞吐量可以達到兩個單核心的90%。Bulldozer採用嶄新的雙核心模組設計方式,算是以成本考量優先,比較有「C/P值」的設計新思維。
效能才是指標
記憶比較好的讀者,應該記得Intel Core 2 Quad Q6600這顆由2個E6700組成的處理器,當時就有人說它是「假四核」。時至今日,應該也沒有人會否認它是四核心處理器。筆者認為,CMT架構過於特殊,無法用傳統核心來定義,在規格上做口舌之爭沒有太大的意義,效能才是最重要的指標。
1分鐘看懂Bulldozer架構
Bulldozer使用的CMT架構異於傳統設計,八核心的FX-8150內有4個雙核心模組,並非傳統8個獨立核心。雙核心模組中有共享的浮點運算單元(FPU)、預取器(Fetch)、解碼器(Decode)以及L2 cache,共享著多數的資源,看起來就像是1位能力比較強的員工在做著2人份的工作。
AMD認為超過80%的運算都是整數運算,因此增加少量的核心面積,整數運算單元就能帶來80%的效能提升,是相當划算的交易。而理想中數據經過預取(Fetch)、解碼(Decode)後,經過2個調度器(Scheduler)到達運算單元,同時間可有2個執行緒在運作,理論表現遠高於Intel HT技術帶來的效益。
(後面還有:免費更新檔,裝了效能強)
AMD出的推土機產品卻連上一代的Phenom,這實在是支持者最不想看見的事~
雖然下一代打樁機號稱有15%效能提升,但是以目前來看,就算15%,恐怕也只是跟二代的Core i3平起平做而已,AMD CPU真的要加油了!
看看那些充斥在其他網站的廣告文,真是垃圾...javascript:;
感謝
http://cdn1.techbang.com.tw/system/images/76132/original/2faba67a44f4867d8b5f0107480c6938.jpg?1331029319
只不過印象中速度開始超過10MB的時候就會以MB/s顯示
我認為AMD這步是不得不為,他遲早都要這樣做的
為了CPU與GPU的完美融合在鋪路呀..........
感覺Core 2 Quad系列灌了應該也會變快的意思囉?
Core 2 Quad不是是兩顆雙核心拼起來的嗎?
還是他只對AMD FX系列有用而已?
(但Core 2 Quad Q8400也確實可以灌這個更新就是了...)