每個人在工作中,上天似乎都會安排一些犯衝的人事物。小編也不例外,每次撰寫YouTube題目時都不大幸運,花了一個月寫好的專題,在發刊前後YouTube臨時介面大改版,欲哭無淚;而上週才介紹怎麼在YouTube加入多國字幕後,前陣子YouTube發表運用語音辨識技術自動為上傳的影片加入字幕,看看這個功能能幫我們些什麼忙!
▲Steve Jobs 2005年在史丹福大學畢業典禮上演講的影片,本來就有英文字幕;
也能由右下角「轉錄音訊內容」 看到YouTube語音辨識產生出的字幕。
術語小百科:Caption與Subtitle有什麼差別?
▲這兩個單字都是字幕,但是在意義上卻有些差別。
談到自動字幕功能前,得要釐清兩個術語。YouTube後台的介面中將字幕功能標為:「原文字幕與翻譯字幕」,對應到英文就是Caption和Subtitle兩個單字。看似相同,卻又有少許的差異:
- Caption(原文字幕):
當影片以英文發音,字幕是英文時,就稱作Caption。Caption的主要目的是取代音軌,讓聽障人士也能了解影片中角色的對話,有些還會加入背景配音的說明,讓他們更能了解影片中發生了什麼事。Caption又分兩種:- Closed Caption(隱藏式字幕):
美國曾在1990年訂立「Television Decoder Circuitry Act」法案,要求1993年出產的電視機都要支援顯示隱藏式字幕的功能。主要的目的是讓美國國內的老年人、聽障人士也能有相同的權利使用電視這種媒介;同時讓英文非母語的移民也能理解電視中的內容。於是,在美國電視機的遙控器上會看到「CC」按鍵,就是用來開啟隱藏式字幕。YouTube上具有隱藏式字幕的影片也會顯示CC標記。(不是這個CC,別搞混) - Open Caption(非隱藏字幕):
非隱藏式字幕通常用在電影、新聞中出現非本國語言時,例如中文電影中的英文對話、英文電影中的德文對話。遇到這種場合播映時就會直接加上字幕,讓觀眾不會因為語言障礙而聽不懂。
- Closed Caption(隱藏式字幕):
- Subtitle(翻譯字幕):
當我們在看非中文的DVD或藍光影片時,開啟的翻譯字幕就是Subtitle。
▲左圖:美國電視遙控器上通常會有開啟隱藏式字幕的「CC」按鍵;
右圖:「Objectified」一片採訪德國設計師Dieter Rams時就採用非隱藏字幕翻譯德文。
▲翻譯字幕常用於惡搞,例如希特勒對什麼(iPad、Xbox Live)都有點意見…
YouTube利用語音技術自動抓取字幕
▲現在,只要你上傳的影片以英文發音,就能讓YouTube自動擷取原文字幕。
扯遠了…總之,YouTube現在可以利用Google的語音辨識技術來自動擷取影片中的口白,目前雖然僅有英文,但在接下來的數個月中,其他語言會陸續上線。在使用這項功能時也要注意到,影片音軌中的口白收音一定要乾淨,當有背景雜音、風切音時,就會變得難以辨識。要是你過去有英文發音的影片,也可以套用這項功能來自動擷取。
不過辨識上仍然有些小問題,例如文章一開始的Steve Jobs演講影片,語音辨識就將「Dot EDU」辨識成「Not BTU」;也會將「SIM Card」辨識成「Salmon」(顯然是和Nokia有一腿?)。所以YouTube也建議在辨識完成後,再進行手動調整:
▲經過語音辨識完成後的字幕,可透過這樣的介面檢查,但仍需下載手動修改,不能借助CaptionTube。
自動產生字幕帶來的好處
- 自動產生TimeCode:
上字幕時最麻煩的工作就是找出每段字幕開始與結束的時間。所以當翻譯外國影集時,具有Closed Caption隱藏式字幕的節目翻譯速度會快得很多。YouTube能夠自動產生字幕,時間碼比起內容來得重要許多。 - 協助聽障者也能了解內容:
去年台北市才剛舉辦完聽奧,根據去年的統計,台灣聽障人數約有11萬人。相對於美國在資訊產品上非常注意輔助使用功能(Accessibility),台灣似乎注意的人不算多。但也不是沒有,例如淡江大學就有著盲生資源中心。YouTube這次推出這項功能,主要也是依照前面提到美國1990年制定的法令來協助聽障者。加州一所專收失聰生的高中,就拍下這段影片來感激YouTube的新功能:
再次F**K GFW
字幕跟演員的表情配合得天衣無縫.......