Google 近日公佈去年 11 月投入使用的通用語言模型研究。結果顯示,Google 語言模型現在已經可對 100 多種語言進行識別。在部分通用語言識別上,Google 語言模型的語意理解表現更是亮眼。相較 OpenAI 推出的大型語言模型 Whisper,語意識別錯誤率更低。
根據Google官方介紹,Google 語言模型可進行持續的自我學習,並可在 BEST-RQ 演算法的加持下不斷修改語言模型整體架構,從而完成持續分析、學習語言結構等操作。除此之外,Google語言模型在進行語意理解時,還會調動 text injection 以及監督式 loss 函數,從而讓語言模型語意理解更加精準。
目前,Google語言模型在處理 70 多種語言翻譯時,錯誤率已經可以保持在 30% 以內。
值得一提的是,Google語言模型在處理非裔美籍人士所使用的英語口語 CORAAL、混合口音的 SpeechStew 以及其他多種語言的 FLEURS 測試中,其正確率甚至在 Whisper 之上。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!