2024.09.27 12:00

台灣AI語音技術再進化!VoAI 絕好聲創打造擬真台灣口音AI聲優

ADVERTISEMENT

TTS 是「Text to Speech」的縮寫,中文稱為「文字轉語音」。這是一種技術,可以將輸入的文字轉換成自然流暢的語音輸出。像很多的YOUTUBE頻道,創作者寫好文案後,就利用TTS把這些文案模擬真人唸出來,而且使用越來越普遍。

但台灣應用TTS也遇到幾個問題:一是口音差異。因為大部分中文語音模型以中國口音為主,與台灣在地口音存在差異,可能影響使用者體驗。另外情感表達受限。雖然技術已進步,但在情感表達上仍有改進空間,尤其在需要豐富情感的場景,如笑話、戲劇等。同時相較於中國,台灣可用的中文語音素材較少,這可能會影響到訓練模型的品質和多樣性。

為了解決這些問題,台灣的公司和研究機構正積極投入中文語音模型的訓練,希望能開發出更符合台灣在地需求、情感表達更豐富的TTS模型。

ADVERTISEMENT

台灣科技公司網際智慧股份有限公司,近日推出全新品牌「VoAI 絕好聲創」,專注於打造高擬真台灣口音的AI聲音服務,並提供多達30位AI聲優供選擇。這項服務以親切、富有辨識度的台灣口音為亮點,瞄準本地影音多媒體製作與公眾廣播需求,致力於提供更自然且具情感的AI配音,讓AI聲音不再僅僅是機械式的輸出,而能夠真正「接地氣」。

強化TTS技術,展現台灣本土特色

網際智慧總經理晁旭光表示,憑藉公司超過25年的語音合成技術及豐富經驗,結合生成式AI(Generative AI)與大型語言模型(LLM),VoAI 絕好聲創以精準模擬台灣口音的說話方式和語氣變化為特色。這些AI聲優不僅能夠演繹快樂、生氣、悲傷等多樣情感,還能呈現自然的聲調起伏,與真人對話的相似度極高。未來,VoAI 絕好聲創計劃擴充至100位台灣口音AI聲優,為全球市場提供更多元的中文AI語音選擇,推廣台灣獨特的聲音文化。

ADVERTISEMENT

多元應用場景,引領AI聲音技術新潮流

「VoAI 聲音製造所」是VoAI 絕好聲創推出的線上訂閱平台,使用者可以快速生成具台灣口音的AI語音,並將其應用於廣播、影片旁白、Podcast、教材、有聲書、有聲試卷等各種情境。不僅如此,企業還能透過API服務,將這些擬真聲音整合至自家應用程式或系統,如網站語音朗讀、電話語音系統、虛擬客服、遊戲中的NPC等。

值得注意的是,隨著生成式AI應用愈加普及,像NotebookLM這類技術已能自動將文章轉為Podcast音檔,許多業者也希望能生成中文語音內容。透過VoAI 絕好聲創的API服務,他們即可輕鬆生成擁有台灣口音的高品質AI聲音,助力企業在多元語音需求上開創新局。

這項技術的推出,預示著AI聲音應用的嶄新時代正在到來,尤其對於台灣本地的影音產業和公共服務來說,VoAI 絕好聲創的服務不僅提高了工作效率,也為台灣口音的聲音技術帶來了更多元的商業機會。

ADVERTISEMENT

ADVERTISEMENT