微軟宣佈Azure AI Speech「Avatar」虛擬替身智慧語音服務全面上線,該服務允許開發人員建構支援自然語音的語音功能、多語種、生成式 AI 應用程式。
Azure AI Speech服務中新的文字到語音頭像功能,可以將簡單的文字轉換為逼真的「虛擬替身」以自然的聲音說話的影片。開發人員可以使用作為該服務一部分的任何預建替身,也可以建立自己的自訂替身。
新功能使開發人員能夠為其使用者建立個性化和引人入勝的內容。這項服務的輸出影片解析度為 1920 x 1080,每秒 25 幀(FPS)。
下面是文字轉語音虛擬替身服務的展示:
Azure Speech 文字轉語音「Avatar」具有以下功能:
通過 Azure AI 文字轉語音技術,將文字轉換成逼真的人聲數字視訊,並配以自然的聲音。
提供一系列預製頭像。
化身的聲音由 Azure AI 文字轉語音技術生成。
通過批次合成 API 非同步或即時將文字合成為語音化身視訊。
在 Speech Studio 中提供內容建立工具,無需編碼即可建立視訊內容。
通過 Speech Studio 中的即時聊天頭像工具實現即時頭像對話。
文字轉語音「Avatar」服務的定價有點複雜,收費將基於視訊輸出的長度,並按秒計費。此外,作為文字到語音頭像服務解決方案一部分的文字到語音、語音到文字、Azure OpenAI 或其他 Azure 服務將單獨收費。此外,該服務現在可在以下 Azure 地區使用:東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部。
- 延伸閱讀:OpenAI AI 模型銷量年化收入達 10 億美元已超越微軟,微軟 Azure 團隊面臨銷售壓力
- 延伸閱讀:新光金控攜手微軟 Azure OpenAI 研發智慧金融應用
- 延伸閱讀:微軟Azure AI團隊員工抱怨:許多計畫中的服務被取消,公司已淪為OpenAI的IT部門
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!