MATRIX Voice是款開放源始碼的語音辨識模組,它的外觀是個直徑為3.14英吋的圓盤,不但可以獨自運作,還可以直接安裝在Raspberry Pi的GPIO端子上,能夠透過MATRIX Voice內建的放射狀陣列式麥克風以及FPGA晶片,提升語音辨識品質,協助使用者開發具語音功能的物聯網裝置。
語音辨識再進化
MATRIX Voice的主要特色,就是能提供完整且價格合理的套件解決方案,讓創客能利用親合的工具打造具有語音辨識功能的物聯網裝置。它不但具有完整的硬體設備,也具有MATRIX OS軟體,讓創客可以透過簡單的幾行JavaScript程式語言來控制硬體,大幅簡化開發工作的複雜度。
雖然Raspberry Pi也能連接一般麥克風,作為語音辨識的資料輸入裝置,但是受限於硬體效能與麥克風收音品質的限制,使用起來的效果就不會那麼好。MATRIX Voice在圓盤型的主機板上,內建了7個陣列式微機電麥克風(MEMS Microphone),除了能縮小麥克風尺寸以外,也能提高收音的敏感度,以及降低雜訊,以利提升辨識的精確度。
將MATRIX Voice安裝至Raspberry Pi的方式相當簡單,使用者只需將MATRIX Voice的插座連接至Raspberry Pi的GPIO端子即可,若要讓MATRIX Voice單獨運作,則需在主機板背面的擴充端子安裝ESP32之類的微控制器。將硬體設定妥當後,就能將輸入的聲音透過Microsoft Cognitive、Amazon Alexa、Google Speech API、Wit.ai、Houndify等等線上服務進行辨識,將使用者的語音轉換為各種指令。
▲MATRIX Voice是款能支援多種線上服務的語音辨識模組。
▲主機板的周圍具有7個陣列式麥克風,能夠提升收音品質。
▲由於MATRIX Voice也具有多重提升音質的技術,因此能增加辨識的精確度。
▲安裝至Raspberry Pi時,只需直接將插座插入GPIO端子即可。
▲MATRIX Voice是透過GPIO端子與Raspberry Pi相連。
▲安裝ESP32等微控制器之後,MATRIX Voice也能獨力運作。
支援多種開發工具
MATRIX Voice具有完整的開發環境,使用者可依據程度不同,自由選擇Matrx CLI、Matrix Open Source、Malos、Malos_eye、HAL等不同開發工具,並運用JaveScript、C++、Python、Verilog、VHDL等語言撰寫程式。
另一方面,使用者也能將MATRIX Voice搭配影像辨識系統使用,例如將Raspberry Pi接上攝影機,並搭配OpenCV等API開發工具,讓Raspberry Pi不但能接收語音指令,更能透過手勢操作,或是進行人臉辨識等工作。
MATRIX Voice的預定售價為美金55元(約合新台幣1,700元),加上ESP32微控制器的則為美金65元(約合新台幣2,000元),預定上市時間為2017年5月。
▲使用者可以利用Matrx CLI等工具,開發各種程式來擴充MATRIX Voice的功能。
▲MATRIX Voice支援多種開發工具與程式語言,使用者可以挑選適合自己程度的工具。
▲將Raspberry Pi接上攝影機後,就能夠讓語音與影像辨識協同運作。
▲透過OpenCV等API開發工具,能夠讓程式追蹤使用者的手勢。
▲或是用於偵測人臉,以及面部所呈現的情緒。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!