AMD 在近日發佈的 EPYC 7002 「Rome」伺服器晶片指南中,承認由於時鐘倒計時器存有個BUG,導致第二代 EPYC 晶片正常運行 1044 天後出現核心卡死情況。
使用這款 EPYC 晶片的伺服器,需要每隔 2.93 年時間重新啟動一次,但AMD 官方表示不會修復上述 BUG。
AMD 在指南中表示,導致這個問題的原因是核心無法脫離 CC6 省電模式(Core C6 State),進入該模式之後,會降低電壓和時脈頻率。AMD 澄清說,誤差的時間可能取決於擴頻調製和 REFCLK 頻率參考。
Reddit 使用者 acid_migrain 經過詳細的演算,認為實際導致卡死的時間並非 1044 天,而是 1042 天 12 個小時。
AMD 於 2018 年推出 EPYC “Rome”系列伺服器晶片,部分客戶已經向 AMD 反應遇到了這個問題。
AMD 表示沒有計畫修復該漏洞,外媒 technewsspace 判斷,不修復的理由原因之一是修復成本太高,不然就是受影響用戶規模不大。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!