Google 發布 Gemini 2.5 Flash 預覽版：首款可開關推理功能的混合 AI 模型登場

在上週的 Cloud Next 大會上，Google 宣布即將推出全新 Gemini 2.5 Flash 模型，並強調其帶來多項重大升級。如今，這款模型的預覽版已正式上線，開發者可透過 Google AI Studio、Vertex AI 與 Gemini API 進行體驗，並能結合 Canvas 工具使用，優化文件與程式碼處理效率。

Gemini 2.5 Flash 是 Google 首款具備「完全混合推理」能力的 AI 模型，使用者可依需求選擇是否啟用推理功能，靈活在效能、成本與延遲之間取得平衡。Google 表示，這款模型相較上一代 Gemini 2.0 Flash，不僅推理能力大幅提升，還具備更高的性價比與更低延遲。

價格方案一覽（依美金計價）：

每百萬輸入 token：0.15 美元（約新台幣 4.90 元）
每百萬輸出 token（不含推理）：0.60 美元（約新台幣 19.60 元）
每百萬輸出 token（含推理）：3.50 美元（約新台幣 114.30 元）

雖然目前仍屬早期預覽階段，Gemini 2.5 Flash 相較前一代已展現明顯性能優勢。Google 表示，若不需要推理功能，用戶也可以完全關閉該功能，作為 Gemini Flash 2.0 的直接替代版本。

目前此模型已支援在 Gemini API、AI Studio、Vertex AI 及 Gemini App 中使用，對於需要控制成本又希望取得快速回應的應用場景來說，特別具吸引力。

根據 Google 提供的基準測試資料，儘管價格更具競爭力，Gemini 2.5 Flash 的效能仍可與 Anthropic、xAI 的 Grok 等其他前沿模型一較高下。雖然 OpenAI 最新的 o4-mini 模型在部分性能上略勝一籌，但價格也明顯偏高，對預算敏感的開發者而言，Gemini 2.5 Flash 提供了相對平衡的選擇。