智通科創旗下子公司聯和科創宣布與國立聯合大學的張陳基博士合作開發「VoxHakka 系統」,一款多腔調暨多語者的客語語音合成系統。該成果的學術論文《VoxHakka: A Dialectally Diverse Multi-speaker Text-to-Speech System for Taiwanese Hakka》將於今年第 27 屆Oriental-COCOSDA國際會議上發表。
VoxHakka:臺灣客語多腔調暨多語者的語音合成系統
VoxHakka 是一個專為臺灣客語設計的文字轉語音系統。為解決客語語音公開可用資料稀缺的問題,聯和科創團隊採用一種新穎的網路爬蟲技術以及自動語音辨識技術,確保創建高品質、多語者、多腔調資料集。根據比較平均意見分數進行的嚴格主觀聽力測試證實,VoxHakka 在發音準確性、聲調正確性和整體自然度方面明顯優於現有的公開客語語音合成系統。
該系統基於 YourTTS 架構,實現了語音合成的高自然度、準確性及低延遲,並且獨特地支援所有六種主要的客語腔調。透過使用特定腔調的資料訓練模型來實現,從而能夠生成具備語者特徵的客語語音。
VoxHakka 系統的研發,成功解決了保存與活化瀕危的臺灣客語所面臨的挑戰。
聯和科創 AI 部門的李鴻欣博士表示,「這個項目突顯了我們致力於運用 AI 產生積極社會文化影響力的貢獻,特別是在傳統語言保存的領域。」VoxHakka 根據 CC-BY 4.0 授權(https://voxhakka.github.io)免費提供,旨在鼓勵其成果可以在研究、教育和創意應用中被廣泛使用。這種開放取用方法也促進了客家社群內外的協作和創新。
該成果的學術論文將於今年第 27 屆 Oriental-COCOSDA 國際會議上發表。O-COCOSDA 是東方口語語音資料庫和評估技術協調與標準化委員會的縮寫,該委員會成立於 1997 年,主要探討語音資料庫及語音處理的評估技術,為研究人員、業界專家和從業者提供一個交流最新研究成果和合作機會的平台,涵蓋了自動語音辨識、自然語言處理和語音合成等領域。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!