科學家研發AI聲納眼鏡：可識別唇語，精準率達 95% | T客邦

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

2024科技趨勢金獎

科學家研發AI聲納眼鏡：可識別唇語，精準率達 95%

美國康奈爾大學的研究人員開發了一種新技術，可以通過聲納眼鏡進行無聲溝通。這種眼鏡利用微型揚聲器和麥克風來讀取佩戴者默念的單詞，從而可以在不需要實體輸入的情況下執行各種任務。

延伸閱讀：Adobe 發表 AI工具 Firefly，不止根據文字生成圖像，未來將給Photoshop等工具帶來顛覆性改變

這項技術由康奈爾大學的博士生張瑞東（音譯）領導開發，是在一個類似的計畫基礎上進行的改進，該計畫使用了一個無線耳機，而之前的模型則依賴於鏡頭。

據瞭解，該聲納眼鏡使用一種名為 EchoSpeech 的無聲語音識別介面，利用聲納來感知嘴部運動，同時使用一個深度學習演算法即時分析回波特徵。這使得系統能夠以約 95% 的精準率識別佩戴者默念的單詞。

這項技術最令人興奮的前景之一是，對於有語言障礙的人來說，可以使用它來無聲地將對話輸入到語音合成器中，然後將單詞大聲說出來。眼鏡也可以用來在安靜的圖書館中控制音樂播放，或者在嘈雜的音樂會上口述資訊。

該技術既小巧又低功耗，也不會侵犯隱私，因為沒有資料離開使用者的手機。這樣，就不會有隱私方面的擔憂。眼鏡佩戴非常方便，比其他可用的無聲語音識別技術更實用、更可行。

研究人員表示，該系統只需要幾分鐘的訓練資料來學習使用者的語音模式，學習完成後，就可以朝使用者的臉上傳送和接收聲波，感知嘴部運動，同時使用深度學習演算法分析回波特徵。該系統目前能夠識別 31 個孤立的命令和一串連續的數字，並且錯誤率低於 10%。

該系統目前的版本提供了大約 10 小時的電池續航，並且可以通過藍牙無線地與使用者的智慧型手機通訊。智慧型手機負責處理和預測所有資料，並將結果傳輸到一些“動作鍵”，讓它可以播放音樂、與智慧裝置互動或啟動語音助手。

康奈爾大學智慧電腦介面未來互動（SciFi）實驗室正在利用康奈爾大學的一個資助計畫來探索將這項技術商業化的可能性。

#人工智慧 #ai #科普新知

送【10個ChatGPT的好工具】電子書 Line brand icon

使用 Facebook 留言

謹慎發言，尊重彼此。按此展開留言規則