Google最新發布的Gemini 2.5 Flash AI模型更加注重效率

Google宣布即將發布新的人工智慧模型，旨在提供強大的效能並注重效率。該模型名為 Gemini 2.5 Flash，即將在Google的 AI 開發平台 Vertex AI 上推出。該公司表示，該模型提供「動態且可控」的運算能力，允許開發人員根據查詢的複雜性調整處理時間。

Google在一篇部落格文章中寫道：「使用者可以根據自己的特定需求調整速度、準確性和成本平衡。這種靈活性對於在高容量、成本敏感的應用中優化 Flash 效能至關重要。」

Gemini 2.5 Flash 的發布正值旗艦 AI 模型價格持續上漲之際。像 2.5 Flash 這樣價格更低、效能更強大的模型，雖然犧牲了一定的準確度，但卻為昂貴的頂級產品提供了一個極具吸引力的替代方案。

Gemini 2.5 Flash 是一款「推理」模型，類似於 OpenAI 的o3-mini和 DeepSeek 的R1。這意味著它需要更長的時間來回答問題，以便進行事實查核。

Google表示，2.5 Flash 非常適合客戶服務和文件解析等「大容量」和「即時」應用。

Google在其部落格表示：「這款主力機型專門針對低延遲和降低成本進行了優化。對於反應式虛擬助理和即時摘要工具而言，規模效率至關重要，因此它是理想的引擎。」

Google尚未發布 Gemini 2.5 Flash 的安全或技術報告，這使得了解該模型的優勢和不足之處變得更加困難。該公司此前曾表示，它不會發布其認為是「實驗性」的模型的報告。

Google還宣布，計畫從第三季開始將 2.5 Flash 等 Gemini 模型導入本地環境。該公司的 Gemini 模型將在Google分散式雲端 (GDC) 上提供，GDC 是Google為有嚴格資料治理要求的客戶提供的本地解決方案。Google表示，它正與 NVIDIA 合作，將 Gemini 模型導入符合 GDC 標準的 NVIDIA Blackwell 系統，客戶可以透過Google或其首選管道購買。