IBM 推出新一代企業 AI 模型 Granite 3.0，具備高性能、透明度與安全性

IBM 在 TechXchange 年度技術大會上發表旗艦級模型系列第三代 Granite 3.0。Granite 3.0 經由寬鬆的 Apache 2.0 許可發布，在許多學術與行業評比測試中，均超越或與類似規模的競者模型並駕齊驅，展現優異性能、建模彈性、透明度與安全性。

文章目錄

性能領先 Meta 與 Mistral 類似大小的開源模型
搭配企業數據，在特定任務場景展現優異性價比
Granite Guardian 安全護欄，更提供獨有 RAG 特定檢查
將支持擴展到 128K 上下文窗口和多模型文件理解能力

此次發布的 IBM Granite 3.0 系列模型包括：

通用/語言模型：Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
護欄與安全模型：Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
專家混合模型：Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

性能領先 Meta 與 Mistral 類似大小的開源模型

Granite 3.0 8B 與 2B 被設計為企業級 AI 的主力模型，可為檢索增強生成、分類、摘要、實體提取、工具使用等企業任務；而這些小巧、多功能模型可以根據企業數據進行微調，與業務場景或工作流程無縫整合。

在性能方面，Granite 3.0 8B Instruct 模型在 Hugging Face 的 OpenLLM 排行榜評比測試中，平均領先 Meta 與 Mistral 類似大小的開源模型的最佳性能。在 IBM 的 AttaQ 安全評比測試中，上述模型在所有受測的安全維度裡，表現均優於 Meta 與 Mistral 的模型。

▲ Hugging Face 的 OpenLLM 排行榜 (v2) 中包含的基準平均分。

另外，在這次發布裡還有專家混合架構 Granite 3.0 1B-A400M 與 Granite 3.0 3B-A800M，這些較小型、輕量級的模型可建置在傳統 CPU 伺服器，用於低延遲應用程式，兼顧性能與推理成本。IBM還發布預訓練 Granite 時間序列模型的更新版本。這些新模型基於多三倍的數據量訓練，具備更高的建模彈性、支持外部變量與滾動預測。在三個主要時間序列模型評比中，Granite 的性能超越了 Google、阿里等規模大十倍的模型。

搭配企業數據，在特定任務場景展現優異性價比

在特定任務上啟用小型 Granite 模型，搭配企業自有數據，加上使用 IBM 與 RedHat 在今年五月推出的對齊技術 InstructLab，企業能夠在獲得與使用其他大型模型相同效能下，大幅降低成本。（根據數個早期概念驗證案例進行的成本分析結果顯示，成本減少約 3 至 23 倍）

而在透明度方面，Granite 3.0 技術報告與負責任使用指南中，均詳細描述了訓練這些模型的數據集、所採用的數據過濾、清洗與處理步驟；並詳列它們在主要學術與行業評比測試裡的性能結果。另外，IBM 也為 watsonx.ai 平台上的所有 Granite 模型提供智慧財產權賠償保證，強化企業客戶採用此模型的信心。

Granite Guardian 安全護欄，更提供獨有 RAG 特定檢查

IBM 推出新的 Granite Guardian 模型系列，應用開發人員可以透過檢查使用者提示與 LLM 回應來建置「安全護欄」，提前發現各種風險。Granite Guardian 3.0 8B 與 2B 模型提供完整的風險與危險檢測功能；也可與任何其他開放或專用的 AI 模型共同使用，強化 AI 安全保護機制。

▲ 比較模型在安全基準上的效能，測量對不同類別的不良反應的穩健性。

除了偏見、仇恨、髒話、褻瀆、暴力、嘗試破解限制等 AI 危害指標，Granite Guardian 模型還提供了獨有的 RAG 特定檢查，例如是否基於事實、與上下文的相關性、與答案的相關性等。在針對安全性與 RAG 標準的 19 項廣泛測評中，Granite Guardian 3.0 8B 模型對於危害檢測的整體準確性，平均優於 Meta 既有三個版本的 Llama Guard 模型；它接受幻覺檢測的整體表現，也與專門用於幻覺檢測的模型 WeCheck 和 MiniCheck 相當。

將支持擴展到 128K 上下文窗口和多模型文件理解能力

Granite 3.0 模型使用超過 12 萬億個標記的數據量訓練而得；數據來自 12 種不同的自然語言，與 116 種不同的程式語言。預計到今年底前，Granite 3.0 8B 與 2B 模型將支持擴展到 128K 上下文窗口和多模型文件理解能力。

在開放性方面，全 Granite 3.0 模型組與更新版的時間序列模型，均可在 HuggingFace 上根據寬鬆的 Apache 2.0 許可證下載。新的 Granite 3.0 8B 和 2B 語言模型的指令變項、以及 Granite Guardian 3.0 8B 和 2B 模型，已在 IBM watsonx 平台商用。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務提供，並通過 Google Cloud 的 Vertex AI Model Garden 與 HuggingFace 的整合提供。

為向開發人員提供多種選擇和易用性，並支持本地和邊緣應用，精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上取得。新一代 Granite 模型擴充了 IBM 強大的開源 LLM 目錄：IBM 與 AWS、Docker、Domo、Qualcomm Technologies（通過其 Qualcomm AI Hub）、Salesforce、SAP 等合作夥伴合作，將多種 Granite 模型整合在它們的產品裡或平台上。

IBM 同時宣佈將 Granite 3.0 設定為 IBM Consulting Advantage AI 賦能服務平台上的預設 AI 模型。全球 16 萬位 IBM 諮詢顧問可以在各種客戶應用場景裡，如客戶服務或 IT 現代化，輕鬆方便地應用 Granite 模型，更敏捷、高效、經濟地為客戶提供商業價值。