ADVERTISEMENT
語音辨識技術正在改變我們使用科技的方式,Google、微軟、蘋果等科技大廠都有推出自己的語音助理。不過,對於其他廠商來說,發展語音辨識技術的前提,就是要有足夠多的語音資料,這是最困難的地方。而開發Firefox的Mozilla為了解決這個問題,目前向所有用戶發出邀請,希望大家都能來提供自己的語音資料,協助他們打造一個免費的語音引擎。
Mozilla 表示,語音識別技術正在改變我們與機器進行互動的關係,不過目前可供使用的系統都相當昂貴並且是專有的技術。為此Mozilla推出 Common Voice 計畫(同聲計畫),旨在讓語音識別技術變得更好也能免費使用。
而在今年三月份,他們已經釋出第一批多語語音資料集,其中共涵蓋 18 種語言的錄音紀錄,包括:英文、法文、德文和中文(繁體) 等廣泛通行的語言,以及威爾斯語及卡拜爾語 (Kabyle) 等較為冷門的語言。Common Voice 共收集到逾 4.2 萬人貢獻的錄音,總長度約 1,400 小時,且語音資料量仍持續成長中。
ADVERTISEMENT
這個計畫主要是希望全球的使用者都可以提供自己的語音,將自己的語音加入到公共資料庫中。透過這個龐大的語音資料庫,可以讓任何人或開發者快速輕鬆地訓練出能夠識別任何語音的應用程式。
不過,光是有語音資料庫還不夠,還要有一個語音辨識引擎。因此除了建立語音資料庫外,Mozilla 也還再建構一個名為 Deep Speech 的開源語音識別引擎,未來等到這個辨識引擎成熟之後,也會開放給所有人免費使用。
ADVERTISEMENT
透過這個計畫,Mozilla希望讓開發者可以打造效果媲美微軟、Google等大公司效果一樣好的語音辨識應用程式,例如在即時翻譯、語音助理等等方面,也可以透過與大公司旗鼓相當的語音資料數量,達到足以與大公司的產品一較長短的程度。
特別需要中文語音使用者的加入
另外,Mozilla 也表示,目前語音助理、語音應用,多數都是以英語系的用戶為主。與英語相比,中文的語音助理成熟度要比英文系的來得低,主要就是資料數量不夠多的關係。因此,他們表示需要更多中文用戶,為這個計畫提供中文語音。如果你覺得自己的口音不標準,講話不清晰也都沒關係。因為語音辨識本來就需要不同的口音來加強判斷。
ADVERTISEMENT
此外,如果你不想錄音的話,也有其他方式來幫忙這個計畫。目前中文語音已經收集了許多的語音片段,不過,單純靠機器識別的準確率並沒有那麼高,所以需要你幫助輔助判斷。
ADVERTISEMENT