當一場會議中的與會者來自不同國家,翻譯就成了急需解決的大問題。如果是國際級會議,傳統的方式是安排即時口譯人員,讓不同語系的與會者戴上同步口譯的耳機,藉此接收到相同的會議內容。但規模較小的簡報會議,負擔的起口譯人員的成本嗎?
近年來由於 AI 人工智慧的興起,機器翻譯在深度學習的加持下取得突破性的進展。微軟也透過深度學習讓自家的機器翻譯技術獲得長足的進步,並將這些成果移植到前兩年推出的「Microsoft Translator」多語言商用翻譯系統中。
先前 T 客邦曾經介紹過,微軟在 Microsoft Garage 專案中有一個名為「Presentation Translator」的 PowerPoint 增益集工具,這個工具正是基於 Microsoft Translator API 所開發出來的。在先前的報導中,我們示範過如何利用「Presentation Translator」將整份簡報翻譯成不同的語言,讓你在十秒鐘內搞定整份簡報的翻譯工作。
事實上「Presentation Translator」厲害的地方還不止於此,它最大的亮點是可以處理會議現場的簡報即時語音,像是將報告人所「說」的內容即時轉換成字幕,還能同步翻譯成不同的語言,完全取代人工口譯的角色!
聽起來是不是很神奇?接著我們帶大家深度體驗一下這個功能,看看在 PowerPoint 裡可以怎麼使用它。
「Presentation Translator」兩大即時語音處理功能
「Presentation Translator」主要有以下兩大功能:
- 即時語音辨識、產生字幕:將發表者所闡述的內容同步轉換成字幕顯示在簡報上。主要依靠的是語音偵測及辨識的技術。
- 即時語音翻譯,產生多國語言字幕:辨識現場的語音後即時翻譯成不同的語系,並產生相對應的字幕。更厲害的地方在於,如果觀眾來自於不同國家 (因此有多國語言翻譯需求),「Presentation Translator」可以同步翻譯出不同語系的字幕,這點非常強大。
由此可知,「Presentation Translator」是一個讓 Microsoft Translator 與 PowerPoint 充分整合並發揮強大連結功能的好工具。用戶只需到官網下載安裝增益工具,無須費用,馬上就可以使用。安裝的方式請參考 T 客邦先前的文章說明。
必須注意的是,想使用「Presentation Translator」執行即時翻譯、顯示線上字幕,那筆電一定得配置能正常收音的麥克風裝置,除此之外,電腦也要連上網路,才能透過 AI 即時處理語音辨識及翻譯。
如何在 PowerPoint 開啟字幕、直接顯示翻譯結果?
當安裝好「Presentation Translator」之後,無論要顯示即時中文字幕,或翻譯成多國語言字幕(目前支援多達 63 種語言),首先都要進行設定。接著來看一下設定的步驟有哪些。
選擇「投影片放映」的頁籤,點擊右方欄位有一個名為「開始字幕」的選項。
由於過程中會大量應用機器學習的功能、使用用戶的語音及文字資訊,因此在開始前必須先詳閱有關隱私的注意事項。
接下來是一連串的功能簡介,你可以選擇跳過。
再來就是設定表達的語言,以及希望字幕顯示哪種語言,假使說的是中文、希望顯示出英文字幕,那就在頭一項選擇「Chinese Traditional」、第二項選擇「English」即可。接著按下「開始字幕」。
第一次使用,設定準備的時間會比較長,大約需要等待五分鐘。
當看到以下這個畫面,就點擊「開始顯示字幕」鈕。
此時系統會顯示「準備字幕中」的畫面,需稍等一下。
設定完成後會切換到投影片放映,不管你的投影片內容是什麼,第一張投影片都會是以下這個畫面,代表字幕功能已經都準備好了,請注意下方紅框處,意指麥克風已經準備好開始進行辨識。
現在可以開始進行簡報囉!對著麥克風說出的中文,會自動轉換出英文字幕並顯示在投影片最下方的黑色區塊。
調整字幕位置
如果你覺得字幕顯示在最下方不易辨識,也可以透過設定將字幕顯示位置調整到簡報的上方,步驟如下。
在「開始字幕」的視窗下方點選「其他設定」。
在「Show subtitles」裡選擇「在投影片上方」這個項目。
回到簡報後就能看到字幕顯示在投影片的上方位置。
同步翻譯!一次滿足來自不同國家的聽眾們
除了前面介紹的一對一即時翻譯功能,即時多國語言同步翻譯才是「Presentation Translator」最大的亮點!讓來自世界各地的人在同一場會議中透過自己的手機(不用安裝額外的 app)就能即時看到自己熟悉的字幕。
到底是怎麼辦到的呢?其實很簡單,Presentation Translator 會針對某一場會議提供一個專屬的網頁作為所有與會者的共同入口,登入專屬網頁後即可取得簡報者原始的語音資料,接著就各自進行語言設定,以同樣的方式在線使用 Microsoft Translator 的機器翻譯功能,即時將翻譯結果成呈現在各自的手機上。由於整個過程都是透過網頁進行,因此只要有瀏覽器就可以取得同步翻譯的結果,完全不需要另行安裝任何 app。
當你在 PowerPoint 按下「開始字幕」之後,一開始會先顯示以下這個頁面,可以看到右下方有一個 QRCode,這個 QRCode 所導向的目的地,就是所有與會者取得原始講稿的統一入口。
接著打開你的手機(iOS、Android皆可)掃描 QRCode。
掃描完畢會跳轉到以下這個網頁,在「加入交談」頁籤下方的「您的語言」中,選擇想要看到的語系。
在範例中我們選擇了日文
最後在「您的名稱」欄目中輸入自己的姓名,按下「輸入」。
之後會看到以下這個頁面,簡報者講了三句話分別是「現在開始測試中文」、「今天的會議開始」、「科技的未來」,紅框處所顯示的正是即時翻譯成日文的結果。
很方便的是你隨時可以退回一開始的設定頁面、然後選擇其他的語言。不過,翻譯結果只會從你進入即時翻譯網頁的那一刻起開始顯示,在這之前簡報者講過的內容不會保留,所以也無法取得早前內容的翻譯結果。
結語:微軟透過 AI 挑戰難度最高的同步口譯
坦白說,機器翻譯現階段還是無法完全取代人工口譯的工作,尤其是專業領域的翻譯。不過,正如前文提到的,如果今天面對的是小型會議,在無法請到專業口譯員的前提下,PowerPoint 提供的「Presentation Translator」依然是目前能找到的最佳解決方案。
透過機器翻譯,單字是最簡單的,再來是長篇文字的翻譯,最困難的當然就是同步語音翻譯。而 PowerPoint 中的「Presentation Translator」就是在挑戰最高難度的翻譯工作。
要實現機器同步口譯的關鍵技術主要有三大:
第一是即時語音辨識,要能夠精確地將人說出的話辨識成文字,一旦辨識錯誤,後續的翻譯自然也就不可能準確到哪去了。
第二則是語意斷句的判別,機器必須要懂得一段話何時停頓、語句要斷在哪裡,並顧及到前後文的連貫性。
第三個關鍵技術就是語言翻譯,首先是不同語系之間的翻譯能力,一般來說,將英文翻譯成歐系語言的技術比較成熟,反觀英翻中的技術則相對沒有那麼成熟;其次,翻譯結果的準確度也與前一項語意斷句的判斷又有著相當緊密的關連。
除此之外,所謂的「專業度」也是非常重要的。一般簡報與學術簡報會用的語句相差極大,翻譯的難度當然也是不一樣的,就機器學習而言,如果能夠事前告知會議的屬性(針對科技、醫學或一般領域),將可以取得更好的翻譯結果。
當然也有一些提高翻譯準確性的技巧,在我們實測的過程中,當簡報者將講話速度放慢,可以取得比較好的語音辨識及翻譯效果,不過速度太慢也會影響斷句的判斷,不見得能提高翻譯結果。此外,語句的停頓時間也很重要,句子與句子之間的停頓點最好明顯一點,這樣機器才能抓到上下文之間的脈絡,可以適時的修正翻譯結果。
不管你對 AI 翻譯的結果滿不滿意,「Presentation Translator」已經讓我們看見機器翻譯進化的起始點。以往透過機器根本不可能進行同步翻譯,而如今「Presentation Translator」做到了!加上使用的人口越來越多,機器學習的腳步也持續向前推進,相信不久的將來,「Presentation Translator」的同步口譯功能將會有更讓人驚艷的進化幅度,讓你對外國人進行簡報時再也不會感到苦惱。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!