Youtube 為了處理耗費大量運算能力的影片轉碼,研發自己的視訊處理晶片 VCU

Youtube 為了處理耗費大量運算能力的影片轉碼,研發自己的視訊處理晶片 VCU

ADVERTISEMENT

大概七年前的時候,帕塔薩拉帝·蘭加納坦(Partha Ranganathan)意識到摩爾定律已經死了。對於這位Google工程副總裁來說,這是一個相當大的問題:他本來指望晶片性能每 18 個月就翻一倍而不會增加成本,而且他還説明組織了採購計畫。圍繞著這個想法,Google每年在運算基礎設施上面都要花費數百億美元。 

但現在,蘭加納坦每四年才能獲得好兩倍的晶片,而且似乎這種差距在不久的將來還會進一步擴大。 

所以他和Google決定要做點什麼。這家公司已經投入數億美元來設計自己的人工智慧定製晶片,也就是所謂的張量處理單元(tensor processing units,簡稱 TPU)。Google現在已經推出了超過四代的 TPU,這項技術讓這家公司在人工智慧方面的努力領先於競爭對手。 

但在Google開發 TPU 時,該公司發現人工智慧並不是唯一可以改進的計算類型。當蘭加納坦和其他工程師開始退後一步,研究自己的資料中心計算最密集的應用時,他們很快就清楚他們接下來應該處理什麼:影片。 

蘭加納坦說:「我的出發點是,『我們要研究的下一個殺手級應用是什麼?』然後我們看了一下現狀,我們發現轉碼占了我們運算週期的很大一部分。」 

YouTube 是迄今為止Google影片相關計算最大的消費者,但它用來獲取、轉換和播放平臺的數十億影片的那種晶片並不是特別擅長轉碼這件事。轉換這一塊任務顯得特別棘手,需要強大的晶片才能有效完成。 

因此,將視訊轉換或轉碼為正確格式,讓影片最終可以在成千上萬台設備播放,蘭加納坦覺得這是一個需要花些時間去解決的好問題。轉碼屬於非常運算密集型的問題,但與此同時,這項任務本身也很簡單,可以設計所謂的專用積體電路或 ASIC 來完成工作。 

晶片行業分析師 Mike Feibus 表示:「對於處理像轉碼這樣非常具體的、高強度的工作負載來說,改進可以獲得巨大收益。」 

2016 年,為了讓管理層批准該專案,蘭加納坦的同事丹納·史托多爾斯基(Danner Stodolsky)給負責監管該公司龐大基礎設施的 YouTube 副總裁史考特·西爾弗(Scott Silver)發了私訊。西爾弗說,他需要大概 40 名員工以及數百萬美元來實現這一目標。 

西爾弗回憶說,自己覺得這個想法很有意義。在與 YouTube 首席執行長蘇珊·沃西基(Susan Wojcicki)進行了 10 分鐘的會面後,YouTube 的第一個視訊晶片專案就獲得放行了。 

西爾弗說:「決策非常非常快,因為從經濟性、工作量以及我們在做的事情來看,做這件事很有意義。」 

去年在一篇技術論文中,YouTube 首次向公眾披露了這款晶片,名字叫做 「阿爾戈斯」Argos(希臘神話裡面的一個長著很多隻眼睛的怪物)。該論文自詡新設計在轉碼運算性能方面實現了 20 到 33 倍的提升。現如今,Google已將第二代的 Argos 晶片部署到其全球的數千台伺服器上,並且還有兩個反覆運算版本正在開發中。 

DIY SOC

Google自研 YouTube 晶片是科技巨頭日益增長的一股趨勢的一部分。亞馬遜已經開發出自己的 Graviton 伺服器處理器,微軟正在開發基於 Arm 的伺服器處理器,Facebook 有一個晶片設計部門——這樣的例子不勝枚舉。 

一個普遍的假設是,大型科技公司正在進軍晶片製造領域,因為這顯然是一種省錢方式。大多數晶片公司的毛利率都在 50% 以上,因此透過把晶片設計流程轉移到內部進行,理論上科技公司就可以節省大量資金。 

但按照 D2D Advisory 首席諮詢師傑·戈德堡(Jay Goldberg)的說法,現實情況並非如此。一方面,這種規劃在經濟上沒有意義——為了節省幾美元的利潤而花費大量精力聘用和培養晶片設計師不值得。光是開發一款新的先進晶片的原型,可能就要花數億美元,然後完善還得再花費數千萬美元。 

西爾弗表示:「我們的重點其實不在於省錢。能省錢當然好,但我們真正想做的,是為受眾提供與其他晶片一樣好的品質體驗,如果不是更好的話。」 

所以他們的動機其實很簡單:大型科技公司想透過自行設計晶片來創造戰略優勢。 

諮詢師戈德堡說:「一般來說,這意味著得有部分軟體綁定到晶片上,軟硬體整合會得到很大的性能提升。」最早,同時也是最著名的例子之一就是Google的 TPU。Google之所以要研發 TPU,是為了處理資料中心那些人工智慧任務。 

戈德堡表示,對於某些工作負載而言,「TPU 可將必須設立的資料中心數量減少 50%。按照一個節點 10 億美元的價格計算,可以省很多錢。」在節省資料中心建設資金的同時,TPU 還讓 Google Cloud 有了微軟 Azure 以及 AWS 當時所沒有的東西。 

但定製晶片設計背後還有另一個動機,這個動機可以追溯到過去 20 年晶片行業的重大整合上。大概 20 年前,有數十家公司要為製造大型科技公司想要的晶片而打得頭破血流,激烈的競爭使得有許多競爭設計可供選擇。 

如今,大多數晶片類別都只剩下一兩家大型晶片製造商可供挑選,資料中心處理器的選項尤其有限,這意味著雲端巨頭無法獲得他們想要的定製晶片。相反,他們只能使用Intel和NVIDIA等公司製造的通用處理器,這些處理器還不錯,但相對比較同質化。 

戈德堡說:「這裡真正要緊的是大型科技公司想要能控制半導體公司的產品路線圖。於是科技公司們自己建立路線圖,他們控制了路線圖,並透過這種方式獲得了戰略優勢。」 

只需按下「播放」

YouTube 把 Argos 晶片叫做視訊編碼單元或 VCU,它的主要工作是將每分鐘上傳到網站的 500 小時的影片,轉換為各種螢幕格式和壓縮格式,讓使用者在從智慧型手機到電視再到筆記型電腦的眾多設備上觀看 YouTube 內容。有時候,這意味著每個影片有多達 15 種衍生變化。 

儘管這款晶片的目的很簡單,而且 Ranganathan 和工程師團隊也很清楚自己希望它能完成什麼,但發明出一塊矽片並不是一件小事。光是 YouTube 的營運規模就帶來了巨大挑戰,這迫使團隊需要全面思考晶片如何設計,從晶片本身開始,一直到晶片所連接的電路板該如何佈置,乃至於資料中心機架的設計,還有如何配置每個集群等問題都需要考慮。 

蘭加納坦說:「如果做出了東西但沒有使用的話,這算真正的落地嗎?你可以造出驚人的硬體。但如果你造出來的東西我們的軟體同事沒法用,那有什麼用?要想讓晶片能用,你還得考慮編譯、工具、調試和部署等等問題。」 

對蘭加納坦來說,開發硬體只是任務的一部分:「這是冰山一角,」他說。深入研究如何將 Argos 晶片整合到公司的資料中心,並以 YouTube 的規模去運行這些晶片,需要軟體和硬體工程師之間的密切合作。 

因此,Argos 是一款由軟體定義的硬體,這意味著研發晶片的工程師可以用所謂的高階綜合技術(high-level synthesis techniques)來加快反覆運算設計的速度。Google開發了自己版本的高階綜合軟體 Taffel ,用來説明製造 TPU 以及 Argos 處理器。 

蘭加納坦說:「在設計 Argos 的時候,我們大力推動採用這種以軟體為中心來設計硬體的做法。」 

 「這裡真正要緊的是要能控制半導體公司的產品路線圖。」 

蘭加納坦還引用了另一個硬軟體緊密合作的例子,那就是工程師如何解決在現場出現故障的 VCU 單元以及一個叫做「黑洞」的問題,也就是在部署晶片失敗後浪費資源的情況。他們的團隊基本上是想出了一種檢測故障和重新引導流量的方法。 

Argos 晶片的第一個版本只是想做一件事,把 YouTube 要轉碼的現有視訊工作負載用更便宜的方式去完成。省下來的錢可以讓 YouTube 把更多影片轉碼成更出色的視訊編碼格式,也就是使用的像素數量要少很多,但圖像品質仍保持一致。檔案變小但畫質不變可以帶來巨大好處:儲存和服務成本會更低,營運商會使用更少的頻寬,而消費者載入影片的速度會更快。 

西爾弗說:「我們真正想做到的事情是這個,將所有上傳到 YouTube 的影片轉碼為盡可能多的格式,並獲得最佳體驗。這個問題很棘手。但這款晶片解決了很大一部分問題。」 

與用於資料中心的大多數晶片類似,數億觀看 YouTube 或使用Google其他影片產品的人將完全不會注意到 Argos 晶片的存在。 西爾弗表示,在 YouTube 全球營運的任何一個市場,該公司都沒有觀察到有人對 VCU 的引入做出反應。 

但這不完全是重點。 YouTube 顯然變得更好了,因為它用了Google的定製晶片,這種晶片所做到的事情對於最早在網路營運的公司來說,完全是無法想像的。 

儘管如此,Google只開發出一代可以與NVIDIA、AMD 或Intel製造的晶片競爭的 VCU 是不夠的。Google需要領先半導體巨頭數年才能讓做定製晶片的主張變得有意義。否則,等待那些半導體巨頭的其中一個做這件事情會更有意義。 

但對於 YouTube 來說,設計一塊真正適合特定目的的晶片,而將更複雜、更不確定的問題留給可以處理任何類型運算的昂貴晶片會更有意義。 

西爾弗說:「如果考慮機器學習訓練或推理,這些都屬於 CPU 做不好的那種非常大、非常有趣的工作負載。你可能會質疑說 GPU 就可以很好地處理這些負荷……但如果你的大多數電腦做的都是對影片進行轉碼的工作,而你每年要為此支付數千萬或數億美元的費用的話,那很顯然[投資] ASIC 來做到這一點是更好的。」

 

36Kr
作者

36氪(36Kr.com)累計發表超過10.8萬條包含圖文、音訊、影片在內的優質內容。氪原創內容體系涵蓋新創公司、大公司、投資機構、地方產業與二級市場等內容模組,設置有快訊、深度商業報導

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則