2025.03.26 14:00

Google 推出 Gemini 2.5 Pro最強 AI 模型!推理、程式碼能力大幅躍升,挑戰業界頂尖地位

ADVERTISEMENT

Google 持續在人工智慧領域展現強勁實力,旗下 AI 部門 DeepMind 技術長 Koray Kavukcuoglu 於昨(25)日震撼宣布,正式推出其最新一代 AI 模型 Gemini 2.5。本次率先亮相的實驗版本 Gemini 2.5 Pro,不僅在多項業界通用的評測基準上取得令人矚目的領先地位,更展現出前所未有的強大推理與程式碼撰寫能力,預計將對當前的 AI 技術格局帶來深遠的影響。

 

 

ADVERTISEMENT

據了解,Gemini 系列自推出以來便備受業界矚目,而此次的 2.5 版本更被 Google 定位為新一代的「思考模型」。相較於過往的 AI 模型,Gemini 2.5 強調其在生成回應之前,能夠進行更深入、更複雜的邏輯推理過程。Google 解釋,這種「思考」能力超越了單純的資料分類與預測,更涵蓋了對資訊的細緻分析、嚴謹的邏輯推導、對情境脈絡的全面理解,以及最終做出更明智決策的能力。

Google DeepMind 長期以來致力於提升 AI 的智慧程度與推理能力,並積極探索各種創新技術,例如強化學習(Reinforcement Learning)以及思維鏈提示(Chain-of-Thought Prompting)等。而先前推出的 Gemini 2.0 Flash Thinking 模型,便是 Google 在「思考模型」領域的一次重要嘗試。此次 Gemini 2.5 的問世,則代表 Google 在此方向上取得了更為顯著的突破。透過對基礎模型的重大強化,以及更精進的後續訓練流程,Gemini 2.5 在效能上實現了質的飛躍。Google 更明確指出,未來將把這種卓越的思考能力直接整合到旗下所有 AI 模型之中,使其能夠處理更為複雜艱鉅的問題,並為開發更強大、更具情境感知能力的智慧代理程式奠定堅實的基礎。

 

ADVERTISEMENT

 

Gemini 2.5 Pro 實驗版領先業界,稱霸 LMArena 排行榜

本次首發的 Gemini 2.5 Pro 實驗版,被 Google 視為針對複雜任務所打造的最先進模型。其卓越的性能已獲得業界權威評測機構的認可,在衡量人類偏好的 LMArena 排行榜上,Gemini 2.5 Pro 以顯著的優勢穩居第一,不僅展現了其強大的能力,更證明了其生成內容的高品質與風格。此外,在程式碼、數學、科學等多個關鍵領域的評測基準上,Gemini 2.5 Pro 也展現出強勁的實力,穩居領先地位。

ADVERTISEMENT

在需要高度推理能力的任務方面,Gemini 2.5 Pro 在多項基準測試中均表現優異。即使在不採用如多數投票等可能增加運算成本的測試技術下,Gemini 2.5 Pro 依舊在數學(如 GPQA)和科學(如 AIME 2025)等領域的評測中脫穎而出。更令人驚豔的是,在名為 Humanity’s Last Exam 的資料集上,Gemini 2.5 Pro 在不使用任何外部工具輔助的情況下,取得了領先業界的 18.8% 的分數。據了解,這個資料集由數百位各領域的專家精心設計,旨在捕捉人類知識和推理能力的極限,而 Gemini 2.5 Pro 的優異表現,無疑證明了其在理解和處理複雜知識方面的巨大潛力。

 

 

ADVERTISEMENT

進階程式碼能力再進化,輕鬆打造複雜應用

程式碼能力一直是 Google 在 AI 發展上的重點領域,而 Gemini 2.5 在此方面也取得了顯著的進展,相較於 2.0 版本實現了巨大的飛躍,且未來可望持續精進。Gemini 2.5 Pro 特別擅長創建視覺效果出色的網路應用程式,以及功能強大的代理程式碼應用程式,同時在程式碼的轉換和編輯方面也展現出卓越的效率和準確性。在業界公認的代理程式碼評估標準 SWE-Bench Verified 上,Gemini 2.5 Pro 在經過客製化的代理程式設定後,取得了高達 63.8% 的分數,再次證明了其在程式碼相關任務上的強悍實力。Google 更進一步展示了 Gemini 2.5 Pro 如何運用其強大的推理能力,僅僅透過一行簡單的指令,就能夠自動生成創建電玩遊戲所需的完整可執行程式碼,其能力之強大令人印象深刻。

承襲 Gemini 優勢,擁抱更長上下文視窗

Gemini 2.5 Pro 繼承了 Gemini 模型的核心優勢,包括原生多模態的處理能力以及極長的上下文視窗。本次發布的 2.5 Pro 版本即配備了高達 100 萬個 tokens 的上下文視窗(未來更將提升至 200 萬個),相較於前幾代模型,其效能有了顯著的提升。如此長的上下文視窗,使得 Gemini 2.5 Pro 能夠處理更龐大的資料集,並理解來自不同資訊來源(包括文字、音訊、圖像、影片,甚至完整的程式碼儲存庫)的複雜問題,為開發者和企業用戶提供了前所未有的彈性和可能性。

開放試用與未來展望

目前,開發人員和企業用戶已經可以透過 Google AI Studio 平台開始試用 Gemini 2.5 Pro 的實驗版本。同時,訂閱 Gemini Advanced 的使用者,也已經可以在桌機和行動應用程式的設定中選擇使用 Gemini 2.5 Pro。Google 也計畫在未來幾週內,將 Gemini 2.5 Pro 推廣至其雲端 AI 平台 Vertex AI,並公布更詳細的定價資訊,以便更多使用者能夠以更高的速率限制,將 Gemini 2.5 Pro 應用於大規模的生產環境中。

Google DeepMind 技術長 Koray Kavukcuoglu 強調,他們非常重視使用者的回饋意見,並將持續努力改進 Gemini 的各項功能,以期能以更快的速度,讓 AI 技術變得更加實用,為人類帶來更多便利與創新。Gemini 2.5 Pro 的推出,不僅是 Google 在 AI 領域的又一重要里程碑,也預示著 AI 技術將在推理、程式碼生成等關鍵能力上迎來全新的發展階段。隨著 Gemini 2.5 Pro 的逐步普及,未來在各行各業中,我們或許能看到更多由 AI 驅動的創新應用湧現。

 

 

ADVERTISEMENT