IBM 推出新一代企業 AI 模型 Granite 3.0,具備高性能、透明度與安全性

IBM 推出新一代企業 AI 模型 Granite 3.0,具備高性能、透明度與安全性

IBM 在 TechXchange 年度技術大會上發表旗艦級模型系列第三代 Granite 3.0。Granite 3.0 經由寬鬆的 Apache 2.0 許可發布,在許多學術與行業評比測試中,均超越或與類似規模的競者模型並駕齊驅,展現優異性能、建模彈性、透明度與安全性。

文章目錄

此次發布的 IBM Granite 3.0 系列模型包括:

  • 通用/語言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • 護欄與安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • 專家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

性能領先 Meta 與 Mistral 類似大小的開源模型

Granite 3.0 8B 與 2B 被設計為企業級 AI 的主力模型,可為檢索增強生成、分類、摘要、實體提取、工具使用等企業任務;而這些小巧、多功能模型可以根據企業數據進行微調,與業務場景或工作流程無縫整合。

在性能方面,Granite 3.0 8B Instruct 模型在 Hugging Face 的 OpenLLM 排行榜評比測試中,平均領先 Meta 與 Mistral 類似大小的開源模型的最佳性能。在 IBM 的 AttaQ 安全評比測試中,上述模型在所有受測的安全維度裡,表現均優於 Meta 與 Mistral 的模型。

Hugging Face 的 OpenLLM 排行榜 (v2) 中包含的基準平均分。

另外,在這次發布裡還有專家混合架構 Granite 3.0 1B-A400M 與 Granite 3.0 3B-A800M,這些較小型、輕量級的模型可建置在傳統 CPU 伺服器,用於低延遲應用程式,兼顧性能與推理成本。IBM還發布預訓練 Granite 時間序列模型的更新版本。這些新模型基於多三倍的數據量訓練,具備更高的建模彈性、支持外部變量與滾動預測。在三個主要時間序列模型評比中,Granite 的性能超越了 Google、阿里等規模大十倍的模型。

搭配企業數據,在特定任務場景展現優異性價比

在特定任務上啟用小型 Granite 模型,搭配企業自有數據,加上使用 IBM 與 RedHat 在今年五月推出的對齊技術 InstructLab,企業能夠在獲得與使用其他大型模型相同效能下,大幅降低成本。(根據數個早期概念驗證案例進行的成本分析結果顯示,成本減少約 3 至 23 倍)

而在透明度方面,Granite 3.0 技術報告負責任使用指南中,均詳細描述了訓練這些模型的數據集、所採用的數據過濾、清洗與處理步驟;並詳列它們在主要學術與行業評比測試裡的性能結果。另外,IBM 也為 watsonx.ai 平台上的所有 Granite 模型提供智慧財產權賠償保證,強化企業客戶採用此模型的信心。

Granite Guardian 安全護欄,更提供獨有 RAG 特定檢查

IBM 推出新的 Granite Guardian 模型系列,應用開發人員可以透過檢查使用者提示與 LLM 回應來建置「安全護欄」,提前發現各種風險。Granite Guardian 3.0 8B 與 2B 模型提供完整的風險與危險檢測功能;也可與任何其他開放或專用的 AI 模型共同使用,強化 AI 安全保護機制。

比較模型在安全基準上的效能,測量對不同類別的不良反應的穩健性。

除了偏見、仇恨、髒話、褻瀆、暴力、嘗試破解限制等 AI 危害指標,Granite Guardian 模型還提供了獨有的 RAG 特定檢查,例如是否基於事實、與上下文的相關性、與答案的相關性等。在針對安全性與 RAG 標準的 19 項廣泛測評中,Granite Guardian 3.0 8B 模型對於危害檢測的整體準確性,平均優於 Meta 既有三個版本的 Llama Guard 模型;它接受幻覺檢測的整體表現,也與專門用於幻覺檢測的模型 WeCheck 和 MiniCheck 相當。

將支持擴展到 128K 上下文窗口和多模型文件理解能力

Granite 3.0 模型使用超過 12 萬億個標記的數據量訓練而得;數據來自 12 種不同的自然語言,與 116 種不同的程式語言。預計到今年底前,Granite 3.0 8B 與 2B 模型將支持擴展到 128K 上下文窗口和多模型文件理解能力。

在開放性方面,全 Granite 3.0 模型組與更新版的時間序列模型,均可在 HuggingFace 上根據寬鬆的 Apache 2.0 許可證下載。新的 Granite 3.0 8B 和 2B 語言模型的指令變項、以及 Granite Guardian 3.0 8B 和 2B 模型,已在 IBM watsonx 平台商用。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務提供,並通過 Google Cloud 的 Vertex AI Model Garden 與 HuggingFace 的整合提供。

為向開發人員提供多種選擇和易用性,並支持本地和邊緣應用,精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上取得。新一代 Granite 模型擴充了 IBM 強大的開源 LLM 目錄:IBM 與 AWS、Docker、Domo、Qualcomm Technologies(通過其 Qualcomm AI Hub)、Salesforce、SAP合作夥伴合作,將多種 Granite 模型整合在它們的產品裡或平台上。

IBM 同時宣佈將 Granite 3.0 設定為 IBM Consulting Advantage AI 賦能服務平台上的預設 AI 模型。全球 16 萬位 IBM 諮詢顧問可以在各種客戶應用場景裡,如客戶服務或 IT 現代化,輕鬆方便地應用 Granite 模型,更敏捷、高效、經濟地為客戶提供商業價值。

ycr
作者

PC home 雜誌、T 客邦產業編輯,也負責 T 客邦影新聞 YouTube 頻道短影音製作。關注 AI 相關應用,並有軟體教學報導。(大頭貼為 AI 生成)

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則