
ADVERTISEMENT
在上週的 Cloud Next 大會上,Google 宣布即將推出全新 Gemini 2.5 Flash 模型,並強調其帶來多項重大升級。如今,這款模型的預覽版已正式上線,開發者可透過 Google AI Studio、Vertex AI 與 Gemini API 進行體驗,並能結合 Canvas 工具使用,優化文件與程式碼處理效率。
Gemini 2.5 Flash 是 Google 首款具備「完全混合推理」能力的 AI 模型,使用者可依需求選擇是否啟用推理功能,靈活在效能、成本與延遲之間取得平衡。Google 表示,這款模型相較上一代 Gemini 2.0 Flash,不僅推理能力大幅提升,還具備更高的性價比與更低延遲。
價格方案一覽(依美金計價):
-
每百萬輸入 token:0.15 美元(約新台幣 4.90 元)
-
每百萬輸出 token(不含推理):0.60 美元(約新台幣 19.60 元)
-
每百萬輸出 token(含推理):3.50 美元(約新台幣 114.30 元)
雖然目前仍屬早期預覽階段,Gemini 2.5 Flash 相較前一代已展現明顯性能優勢。Google 表示,若不需要推理功能,用戶也可以完全關閉該功能,作為 Gemini Flash 2.0 的直接替代版本。
目前此模型已支援在 Gemini API、AI Studio、Vertex AI 及 Gemini App 中使用,對於需要控制成本又希望取得快速回應的應用場景來說,特別具吸引力。
根據 Google 提供的基準測試資料,儘管價格更具競爭力,Gemini 2.5 Flash 的效能仍可與 Anthropic、xAI 的 Grok 等其他前沿模型一較高下。雖然 OpenAI 最新的 o4-mini 模型在部分性能上略勝一籌,但價格也明顯偏高,對預算敏感的開發者而言,Gemini 2.5 Flash 提供了相對平衡的選擇。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!