歲月不饒人,效能擂台不吃香
整體而言,Xeon E5-2650 v2無論在時脈、IPC(Instructions per cycle,每周期指令)、指令集相容性(僅支援AVX而不支援AVX2)都落後於這次參賽的其他處理器,可以預期在單核效能將敬陪末座。
不過這台洋垃圾透過雙路處理器的方式,拼湊出16個實體核心,則是參賽選手中最高的規格,所以多核心效能表現是否能逆轉勝,才是這場比賽的重點。
在測試項目的挑選上,筆者將專注於處理器的部分,而略過與顯示效能有關的測試,其原因除了可以預期洋垃圾的顯示效能真的跟垃圾一樣之外,在實際操作過程中它甚至無法執行Cinebench R15的OpenGL測試。話說回來看其他對手霸凌僅搭載32MB顯示記憶體的Matrox G200eh顯示卡,好像也沒什麼意義。
效能擂台的精彩賽況,就請各位看倌拖板凳、拿雞排,慢慢觀賞下列的圖表與賽評。
▲透過實際操作錄影可以看到其實2路Xeon E5-2650 v2的實力並沒有完全發揮出來,在第2顆處理器的執行緒占用率只有50%左右,導致多核心效能無法完全發揮。
補充資料:NUMA(Non-Uniform Memory Access,非統一記憶體存取架構)節點
簡單地說,NUMA節點就是把SMP(Symmetric Multiprocessing,對稱多處理)的單元細切,每個節點有獨立的記憶體子系統。以本文的洋垃圾為例,單一處理器與其週邊的4組記憶體通道構成1個NUMA節點,而整台伺服器共有2個NUMA節點。
若系統存取的資料為於同一NUMA節點,那麼會因為節點中只有4通道記憶體,而不會有等效8通道的效能。
若存取的資料位於多個不同NUMA,則需要透過QPI等匯流排進行跨處理器資料傳輸,因此還要考慮傳輸耗損與QPI瓶頸,而不會是單純疊加,也無法發揮等效8通道的效能,因此上述記憶體測試成績只能說是「看爽的」,而無法真實反映實際運作情況。
做個簡單的總結,隨著IPC效能與時脈的提升,當代處理器單一核心的效能大約能達到Xeon E5-2650 v2的3倍,因此6核心的處理器就能超越2路Xeon E5-2650 v2共有16核心的表現,若考慮Ryzen R5 5600X的預設TDP只有65W,2路Xeon E5-2650 v2的總合高達190W,當代處理器電力效率也是大幅領先,可真是歲月不饒人,當年叱吒風雲的洋垃圾也要變成貨真價實的垃圾了。
而另一個有趣的題外話,則是可以從這個測試結果看出Intel祖傳工藝的進化,2013年推出的Xeon E5-2650 v2採用22nm節點製程,隨著Intel於2015年的Broadwell微架構進入14nm節點製程後,到2020年推出的Core i9-10900K都是採用「同款但不同師父」的14nm節點製程,隨著設計與電晶體結構的改善,仍能讓Core i9-10900K的單核心效能達到洋垃圾的3倍左右,可見不斷最佳化的祖傳工藝還是有所進步。不過認真地說,Intel在製程工藝上還是有所長進,雖有提升電晶體密度但沒有改變命名方式,所以有點吃了悶虧,詳細解說可以參考筆者先前撰寫的《 半導體製程怎麼命名比較好?Intel:遵照摩爾定律走就對了》一文。
在看完了可能具有一點娛樂性,但沒有什麼實質功用的效能測試後,可以發現洋垃圾雖然有著核心數的優勢,但在整體效能表現上並不吃香,於是筆者最後想到可以「揮霍」多核心數的使用情境……拿來跑Android模擬器。
繼續閱讀 – 退役伺服器處理器改造的家用主機,跑得動幾個Android模擬器?洋垃圾戰記(6)
回到全文目錄
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!