ADVERTISEMENT
Google宣布即將發布新的人工智慧模型,旨在提供強大的效能並注重效率。該模型名為 Gemini 2.5 Flash,即將在Google的 AI 開發平台 Vertex AI 上推出。該公司表示,該模型提供「動態且可控」的運算能力,允許開發人員根據查詢的複雜性調整處理時間。
Google在一篇部落格文章中寫道:「使用者可以根據自己的特定需求調整速度、準確性和成本平衡。這種靈活性對於在高容量、成本敏感的應用中優化 Flash 效能至關重要。」
Gemini 2.5 Flash 的發布正值旗艦 AI 模型價格持續上漲之際。像 2.5 Flash 這樣價格更低、效能更強大的模型,雖然犧牲了一定的準確度,但卻為昂貴的頂級產品提供了一個極具吸引力的替代方案。
ADVERTISEMENT
Gemini 2.5 Flash 是一款「推理」模型,類似於 OpenAI 的o3-mini和 DeepSeek 的R1。這意味著它需要更長的時間來回答問題,以便進行事實查核。
Google表示,2.5 Flash 非常適合客戶服務和文件解析等「大容量」和「即時」應用。
Google在其部落格表示:「這款主力機型專門針對低延遲和降低成本進行了優化。對於反應式虛擬助理和即時摘要工具而言,規模效率至關重要,因此它是理想的引擎。」
ADVERTISEMENT
Google尚未發布 Gemini 2.5 Flash 的安全或技術報告,這使得了解該模型的優勢和不足之處變得更加困難。該公司此前曾表示,它不會發布其認為是「實驗性」的模型的報告。
Google還宣布,計畫從第三季開始將 2.5 Flash 等 Gemini 模型導入本地環境。該公司的 Gemini 模型將在Google分散式雲端 (GDC) 上提供,GDC 是Google為有嚴格資料治理要求的客戶提供的本地解決方案。Google表示,它正與 NVIDIA 合作,將 Gemini 模型導入符合 GDC 標準的 NVIDIA Blackwell 系統,客戶可以透過Google或其首選管道購買。
ADVERTISEMENT