2024.08.16 15:00

iKala 推出 TMMLU+ 驗證集,提升繁體中文大語言模型的精確度與本地化

ADVERTISEMENT

隨著 AI 持續蓬勃發展,台灣市場對於繁體中文模型的技術需求也在日益增長。iKala 近期推出的繁體中文驗證集「TMMLU+」,正式被 AI 語言模型學術會議 COLM( Conference on Language Modeling)接受。

COLM 由來自 DeepMind 、 Meta 和 Microsoft 及常春藤等 AI 領域的知名學者共同創立,為極具公信力的 AI 組織。 iKala 所開發的繁體中文驗證集「TMMLU+」在眾多論文審查過程中,獲得前 10% 的高分,展現出 iKala 在 AI 技術上的強大實力。

自生成式 AI 技術崛起,各國都致力於發展與自身語言相關的大語言模型(LLM),台灣亦有不少企業正著手發展繁體中文模型。有鑒於各國語言的差異性,台灣特有的文化和用字習慣,例如「8+9」、「北車」或台語等,使繁體中文大語言模型在建構的過程中,也需要專屬驗證集進行調校,才能獲得更精準的 AI 應用成果。

ADVERTISEMENT

iKala 內部 AI 團隊基於聯發科所推出的框架 TMMLU,透過社群媒體資料進行更深入的擴展,涵蓋更多台灣本地用語和人文背景,讓新開發出的繁體中文驗證集 TMMLU+  能更貼近繁體中文的詞語情境和表達方式,加上形式開源,可協助國內眾多企業在開發繁體中文大語言模型時,使用繁體中文驗證集 TMMLU+ 作為模型驗證的工具,更貼近本地需求。

iKala 繁體中文驗證集 TMMLU+ 於全球競爭中脫穎而出

iKala 繁體中文驗證集 TMMLU+ 於2023年10月著手開發,經數月的緊鑼密鼓的工作後在 2024 年春天送審。在 COLM 評審的過程中,iKala 的 AI 團隊特別針對繁體中文的字形及用法等特色進行詳細說明,闡述其價值所在。此舉大大加深評審委員的印象,有效提升繁體中文驗證集 TMMLU+ 的論文評分,使其在來自全球激烈的競爭中脫穎而出。

ADVERTISEMENT

目前繁體中文驗證集 TMMLU+ 已被多家台廠採用以進行大語言模型評測,為台灣科技業提供可靠且統一的驗證標準。這不僅是業界對 iKala 多年來深耕 AI 技術的肯定,也有助於提升 iKala 在業界的話語權和影響力。

iKala 共同創辦人暨執行長程世嘉表示:「 iKala 作為來自台灣的跨國 AI 公司,致力於解決困難但充滿意義的 AI 難題,並以實際商業價值和應用場景作為最終目標。非常感謝 AI 團隊成員們的努力,讓 iKala 有機會被國際看見,也感謝聯發科引領台灣 AI 開源技術。」

 

ADVERTISEMENT

ADVERTISEMENT