Google發佈Gemini 2.0 Flash Thinking實驗版，擁有推理能力

Google發佈了一種新的"推理"人工智慧模型--但它還處於實驗階段，新模型名為 Gemini 2.0 Flash Thinking Experimental（一個拗口的名字），可在AI Studio 中使用，這是 Google 的人工智慧原型開發平台。模型卡將其描述為"最適合多模態理解、推理和編碼"，能夠在程式、數學和物理等領域"推理最複雜的問題"。

負責 AI Studio 產品的 Logan Kilpatrick 稱 Gemini 2.0 Flash Thinking Experimental 是「（Google）推理之旅的第一步」。

Google人工智慧研究部門 Google DeepMind 的首席科學家傑夫-迪恩（Jeff Dean）在自己的發文中說，Gemini 2.0 Flash Thinking Experimental「訓練使用思考來加強推理」。

迪恩說：「當我們增加推理時間的計算量時，我們看到了可喜的成果。」推理時間指的是模型在考慮問題時運行所使用的計算量。

Gemini 2.0 Flash Thinking Experimental 基於Google最近發佈的Gemini 2.0 Flash 模型而建構，在設計上似乎與 OpenAI 的o1 和其他所謂的推理模型相似。與大多數人工智慧不同的是，推理模型可以有效地自我檢查事實，這有助於它們避免一些通常會絆倒人工智慧模型的陷阱。

缺點是，推理模型通常需要更長的時間（通常是幾秒到幾分鐘）才能得出解決方案。

給定一個提示後，雙子座 2.0 快速思維實驗系統會暫停一下再做出反應，同時考慮一些相關的提示，並沿途解釋其推理過程。一段時間後，模型會總結出它認為最準確的答案。

▲ Google的推理模型有時會在計算字母上遇到困難。圖片來源：Google

在OpenAI o1 發佈之後，不僅是Google，其他競爭對手的人工智慧實驗室也紛紛推出了推理模型。 11 月初，由量化交易員資助的人工智慧研究公司 DeepSeek 推出了其首個推理模型的預覽版DeepSeek-R1。同月，阿里巴巴的 Qwen 團隊發佈了它聲稱這是 o1 的第一個"開放"挑戰者。

彭博社在 10 月份報導，Google有幾個團隊正在開發推理模型。隨後，The Information在 11 月份的報導顯示，該公司至少有 200 名研究人員專注於這項技術。

並不是每個人都相信推理模型是最好的發展方向。首先，由於運行推理模型需要大量的計算能力，因此推理模型往往價格昂貴。雖然到目前為止推理模型在基準測試中表現出色，但推理模型能否保持目前的發展速度還很不確定。