微軟宣佈Azure AI Speech「Avatar」文字轉語音虛擬替身服務上線

微軟宣佈Azure AI Speech「Avatar」文字轉語音虛擬替身服務上線

微軟宣佈Azure AI Speech「Avatar」虛擬替身智慧語音服務全面上線,該服務允許開發人員建構支援自然語音的語音功能、多語種、生成式 AI 應用程式。

Azure AI Speech服務中新的文字到語音頭像功能,可以將簡單的文字轉換為逼真的「虛擬替身」以自然的聲音說話的影片。開發人員可以使用作為該服務一部分的任何預建替身,也可以建立自己的自訂替身。

新功能使開發人員能夠為其使用者建立個性化和引人入勝的內容。這項服務的輸出影片解析度為 1920 x 1080,每秒 25 幀(FPS)。

下面是文字轉語音虛擬替身服務的展示:

Azure Speech 文字轉語音「Avatar」具有以下功能:

  • 通過 Azure AI 文字轉語音技術,將文字轉換成逼真的人聲數字視訊,並配以自然的聲音。

  • 提供一系列預製頭像。

  • 化身的聲音由 Azure AI 文字轉語音技術生成。

  • 通過批次合成 API 非同步或即時將文字合成為語音化身視訊。

  • 在 Speech Studio 中提供內容建立工具,無需編碼即可建立視訊內容。

  • 通過 Speech Studio 中的即時聊天頭像工具實現即時頭像對話。

文字轉語音「Avatar」服務的定價有點複雜,收費將基於視訊輸出的長度,並按秒計費。此外,作為文字到語音頭像服務解決方案一部分的文字到語音、語音到文字、Azure OpenAI 或其他 Azure 服務將單獨收費。此外,該服務現在可在以下 Azure 地區使用:東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部。

 

 

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則