YouTube團隊揭露背後的特殊演算法，如何讓影片縮圖更吸引人

知名影音網站YouTube提供的影片已經多到數不完，在網站上閒逛、決定要看那支影片的過程，除了靠影片標題來篩選以外，更重要的依據就是影片的預覽縮圖。理想的預覽縮圖應該要充分表達影片的主題與內容，並且能靠鮮明的圖像抓住使用者的眼珠，YouTube為了達成這個目標，開發了特別的演算法來最加化預覽縮圖的動產生流程。

預覽縮圖是吸睛武器

影音網站上的預覽縮圖是多數使用者在尋找感興趣影片的主要依據，也可以說是影音網站的門面，1張理想的預覽縮圖應該具有生動的視覺效果能夠吸引注意力，並且與內容有較強烈的相關性，讓使用者能夠快速瞭解影片的內容。同時理想的預覽縮圖也能提高影片的點擊量，有助於提升影片的傳播力。

YouTube團隊受到近期深度神經網路（Deep Neural Networks，DNNs，更多資料可參考維基百科）在電腦視覺方面技術發展的鼓舞，於是將這個技術運用在圖像與影片分類，強化YouTube影片預覽縮圖產生器的功能，協助影片上傳者能夠輕鬆產生更理想的縮圖。

當影片上傳到YouTube伺服器後，系統會依每秒間隔產生1張樣本畫格，並參考品質模型給予每張樣本畫格各別的品質評分，最後再將得分最高的樣本畫格製作成各種尺寸與顯示比例的預覽縮圖。

這看似簡單的工作流程，其關鍵就是品質模型的評分方式，它也是技術的困難所在。在最新版本的演算法中，YouTube團隊運用了深度神經網路技術，然而它是如何計算品質評分的呢？

▲YouTube會從影片擷取多個樣本畫格，將獲得最高評分的樣本畫格製作成預覽縮圖。（圖片來源：，下同）

讓系統學習如何判斷高下

每個使用者都有自己的喜好，即便大家看到的影片縮圖都是同一張，也可能會產生不一樣的感受，大家可能在意的是影片主題、出現的人物甚至是影片的畫質，於是對於開發團隊來說，第一個重要任務就是要提供哪些資料給深度神經網路，讓這些大量的資料能成為深度神經網路「學習」的教材。

所幸YouTube中有許多影片是由專業使用者提供，他們會額外準備自定的影片縮圖，這種縮圖基本上都會將影片主題、主角置於圖片中央，也不會有失焦或是模糊的情況。所以團對可以將這種具有自定縮圖且受歡迎的影片，設定為高評分的範例，並將其他影片設為低評分範例，如此一來就能讓系統有評分依據。

與先前自動產生預覽縮圖的流程相比，採用深度神經網路技術能夠提高縮圖的品質（更吸引目光、更清楚呈現影片主題），根據團隊以人工方式評鑑的結果顯示，新技術能夠讓65%的縮圖品質有所提升。

YouTube團隊表示它們將在近期把讓這套系統上線，未來使用者將可以享受透過深度神經網路技術提升縮圖品質的方便。團隊也打趣說了個雙關的笑話，如果使用者看到很棒的縮圖（Thumbnails），不要吝嗇舉起你的大姆指（Thumbs Up）。

▲左側為高品質縮圖範例，能夠清楚呈現影片主題。

▲下方為高品質縮圖範例，沒有失焦或是模糊的情況。

▲上方為舊有演算法產生的縮圖，下方則為新演算法，可以看到縮圖品質有所提升。

延伸閱讀：