2018.09.21 17:05

人類冒充 AI 又一樁!語音辨識大廠「科大訊飛」的 AI 同步口譯是人類冒充的

ADVERTISEMENT

2018年9月,人類的AI技術已經可以流暢實現同步口譯了嗎?在上海一場國際會議上,使用了來自知名語音識別公司科大訊飛的「AI同步口譯」;但會後,會議現場的真同步口譯不爽了:「哪有什麼AI同步口譯,明明是剽竊我這個人類同步口譯。」究竟是怎麼一回事?

真同步口譯,假AI

(更新後續報導:那間用人類冒充「AI 同步口譯」的公司跳出來澄清:大家都誤會我了,這叫人機耦合

故事的主角是一位王姓同步口譯,在知乎上的名稱是Bell Wang,以下稱呼她Bell。

ADVERTISEMENT

9月20日,Bell來到上海國際會議中心,為2018創新與新興產業發展國際會議(IEID)的高階裝備技術與產業分會做現場同步口譯。另一位同步口譯員告訴他,這場會議要直播,兩人便精神緊繃的投入到了工作當中。

這個會場的大螢幕被分為了三個區域,中間是分會場的名字和介紹,兩邊則是演講嘉賓的PPT,PPT下方有字幕,左側是中文,右側是英文,兩側的字幕上方都有「訊飛聽見」的logo,讓人覺得這些中英文都是訊飛的作品。

ADVERTISEMENT

第一位外國嘉賓是日本科學院院士福田敏男(Toshio Fukuda)教授,也許日本教授的英口音比較重,「訊飛」聽見了,但是「訊飛」聽不太懂。

英文的語音辨識自動顯示了讀音差不多的詞,但正常人並無法看懂這段「英文」到底是什麼。但是左側翻譯出來的中文,表達清晰,用詞準確,非常流暢!

ADVERTISEMENT

「訊飛聽見」是怎麼在聽不懂英文原文的情況下,如此流暢的翻譯出日本教授的英文演講呢?難道這個AI會讀取意念嗎?當然不是,所有的中文翻譯,都是和Bell搭檔的同步口譯人員現場翻譯的。這裡根本沒有人工智慧翻譯,都是人類智慧翻譯。

像圖中的「就是猿猴的移動」這句話,Bell就認為:「『就是』這種詞,是我們同步口譯在把句子理順時用來聯繫語句的,機器翻譯不可能說『就是』。」想想看,老師問問題,回答不出來的同學,是不是總是「就是……就是……那個……那個」緊張的說不出話來?

ADVERTISEMENT

機器怎麼會緊張?

「訊飛聽見」露餡的地方不只「就是」,在同步口譯的英譯漢譯文中有「步態」這個詞的時候,螢幕上出現的是「不太」;在Bell的漢譯英譯文中有「Davos Forum」(世界經濟論壇:因每年在達佛斯舉辦,俗稱達佛斯論壇)這個詞的時候,螢幕上寫的是「Devils Forum」(魔鬼的論壇)。

毫無疑問,螢幕上的譯文是用語音辨識技術辨識了人類口譯員說出來的譯文,而且辨識得還不太準。

意識到這一點,Bell感到非常厭惡,但是畢竟會議還繼續下去,工作得做,演講得翻譯,他還是繼續認真的翻譯。雖然一度想說一句「本次翻譯由同步口譯Bell Wang所提供」來揭穿一下事實,但考慮到「訊飛」畢竟只是在打擦邊球,沒有明說「是我們的AI同步口譯」,Bell忍下了。

事實出現,狡辯也沒用

但是當天下午,無法狡辯的事實出現了!

Bell的搭檔發現在這個會議在直播的頁面上,寫明了科大訊飛的「智能翻譯」,而且直播中的同步口譯,是把他們二人的同步口譯所翻譯的內容,用機器的聲音讀了出來!憤怒的Bell無法接受這種做法,決定錄下來揭發訊飛。由於視訊直播有延遲,她完整的錄下了搭檔口譯員和直播中的機器人的聲音。

這段影片中,演講嘉賓說可以挖掘資料,然後放入圖表,口譯翻的是「I can mine this data and put it in charts」,但訊飛錯誤的辨識成了「minus data」和「put it in charge」,之後,影片直播中的機器人毫不猶豫地按照錯誤的辨識文本讀了出來。直播中的那個「智能翻譯」完全是按照辨識出的人類口譯員說的話來讀,讀聲音的機器人也沒有斷句。

現在,可以整理一下科大訊飛「AI同步口譯」是怎麼一回事了:

來賓說話→人類同步口譯翻譯,說出譯文→訊飛辨識人類說出的譯文→譯文被投放到螢幕和直播中→直播中投放語音合成的人聲

所以,「智能翻譯」壓根不存在,機器只是辨識人類說出的翻譯,再用機器聲音說出來,這大概就是科大訊飛董事長劉慶峰一直在說的「人機耦合」吧?

同步口譯圈議論紛紛

Bell聲明,「科大訊飛」事前沒有告知他和搭檔會場有語音辨識的字幕,也沒有告訴他們直播的同步口譯是機器朗讀二人翻譯文稿,沒有徵得二人同意就冒名使用了他們的翻譯成果,有侵犯知識產權的嫌疑。而後,更多的同步口譯工作人員出聲了。

有人覺得,AI同步口譯沒那麼容易,這是剽竊同步口譯的工作成果:

還有人覺得,自己辛辛苦苦學了那麼多年的同步口譯,被一個冒充的機器耀武揚威,非常心寒:

不過,也有幫訊飛講話的人,覺得「訊飛聽見」本來就是語音辨識產品:

訊飛往事

其實,這不是訊飛第一次被人指責「剽竊」了。根據觀察者網的報導,去年科大訊飛就被揭發在會議現場同步口譯作弊。情況是這樣的:

科大訊飛的作假方式就是在大型會議上,表面上看現場使用的是訊飛的機器同步口譯,實際上訊飛機器的功能,只是把現場口譯員的話辨識出來,即時投射到螢幕上而已。

 

看上去是不是有種似曾相似的感覺?

同時,更多的人在微博和知乎「me too」了科大訊飛:「不只Bell,他們也找過我做類似的事!」 

AI同步口譯

科大訊飛被指責的體無完膚,其他口口聲聲要替代人類同步口譯的「AI同步口譯」現在是什麼情況呢?簡單的說:「不在大會議上出點問題,都不算是搞AI同步口譯的了。」

今年4月的博鰲論壇,騰訊的同步口譯AI著實被diss(羞辱)了一番。當時,最大的窘態是換著花樣去翻譯「一帶一路」:

還有給出一堆亂碼的情況,好好的同步口譯,突然成了「結巴」。

就在當天,還出現了騰訊緊急找同步口譯來救場的傳言,但後來證實不是騰訊AI同步口譯團隊找人的。同樣,還有號稱「讓同步口譯失業的」搜狗,在會場上的表現可以讓大家看一下。

針對這些窘態,騰訊和搜狗都各有各的解釋,但不能否認技術上仍舊不完美。

事實上,大家對這一點都心知肚明,對新技術的容忍度也很高。但對這些新技術的「浮誇風」,以及刻意製造出來的恐慌,實在很讓人看不起。

值得注意的一點是,跳出來打臉這些AI同步口譯的急先鋒,許多都是專門做同步口譯的。畢竟,誰叫這些AI打算讓口譯員丟飯碗呢!

本文授權轉載自

ADVERTISEMENT