Google AI已經能理解100多種語言，通用語言模型語意理解表現極佳

Google 近日公佈去年 11 月投入使用的通用語言模型研究。結果顯示，Google 語言模型現在已經可對 100 多種語言進行識別。在部分通用語言識別上，Google 語言模型的語意理解表現更是亮眼。相較 OpenAI 推出的大型語言模型 Whisper，語意識別錯誤率更低。

根據Google官方介紹，Google 語言模型可進行持續的自我學習，並可在 BEST-RQ 演算法的加持下不斷修改語言模型整體架構，從而完成持續分析、學習語言結構等操作。除此之外，Google語言模型在進行語意理解時，還會調動 text injection 以及監督式 loss 函數，從而讓語言模型語意理解更加精準。

目前，Google語言模型在處理 70 多種語言翻譯時，錯誤率已經可以保持在 30% 以內。

值得一提的是，Google語言模型在處理非裔美籍人士所使用的英語口語 CORAAL、混合口音的 SpeechStew 以及其他多種語言的 FLEURS 測試中，其正確率甚至在 Whisper 之上。