科技部於國立臺灣科技大學舉辦「AI語音數據資料集」上線發表會。首批開放400小時「科技大擂台 與AI對話」競賽所使用的語音試題資料中,除了自行錄製的資料外,更結合警察廣播電臺及國立教育廣播電臺提供相關語音資料,並由科技部指導、國家實驗研究院科技政策研究與資訊中心(STPI)拓建加值,成為高品質的數據集(Dataset)。
科技部政務次長許有進於發表會上表示:「科技大擂台 與AI對話」挑戰AI在語意理解與語音對話,期望能夠加速開發中文語音對話的核心技術。對 AI 的訓練來說,最重要的就是正確的資料。搭配這個比賽的進行,科技部建立了 AI 語音數據資料庫,也邀請臺北科技大學的廖元甫副教授協助語音資料的標註;由科技部來提供大家方便取得的資料,加速 AI 的訓練與精進。」
本次釋出約400小時的「AI語音數據資料集」,可以大幅縮短發展語音過程中所需的資料標註人力和時間,降低相關技術的發展門檻。資料集在國家實驗研究院高速網路與計算中心資料集平台(NCHC DATA MARKET)上架。此數據集公開釋出後,我國企業、學研界可免費取得授權,用於AI相關技術研發突破,提升臺灣競爭力。
同日,結合2019年語音訊號處理研討會(SPEECH PROCESSING WORKSHOP 2019),共同舉辦「科技大擂台 與AI對話」第二場賽後技術交流會,邀請 Google 臺灣董事總經理簡立峰分享自然語言處理與 AI 未來趨勢的看法、Taiwan AI Labs 創辦人杜奕瑾、臺灣大學資訊工程學系教授,同時也是臺灣 AI 獨角獸沛星互動科技(Appier)首席科學家林軒田博士等,發表目前在 AI 與語音訊號處理的前瞻研究成果。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!