Google發佈Gemini 2.0 Flash Thinking實驗版,擁有推理能力

Google發佈Gemini 2.0 Flash Thinking實驗版,擁有推理能力

Google發佈了一種新的"推理"人工智慧模型--但它還處於實驗階段,新模型名為 Gemini 2.0 Flash Thinking Experimental(一個拗口的名字),可在AI Studio 中使用,這是 Google 的人工智慧原型開發平台。 模型卡將其描述為"最適合多模態理解、推理和編碼",能夠在程式、數學和物理等領域"推理最複雜的問題"。

負責 AI Studio 產品的 Logan Kilpatrick 稱 Gemini 2.0 Flash Thinking Experimental 是「(Google)推理之旅的第一步」。

Google人工智慧研究部門 Google DeepMind 的首席科學家傑夫-迪恩(Jeff Dean)在自己的發文中說,Gemini 2.0 Flash Thinking Experimental「訓練使用思考來加強推理」。

Google發佈Gemini 2.0 Flash Thinking實驗版,擁有推理能力

迪恩說:「當我們增加推理時間的計算量時,我們看到了可喜的成果。」推理時間指的是模型在考慮問題時運行所使用的計算量。

Gemini 2.0 Flash Thinking Experimental 基於Google最近發佈的Gemini 2.0 Flash 模型而建構,在設計上似乎與 OpenAI 的o1 和其他所謂的推理模型相似。 與大多數人工智慧不同的是,推理模型可以有效地自我檢查事實,這有助於它們避免一些通常會絆倒人工智慧模型的陷阱。

缺點是,推理模型通常需要更長的時間(通常是幾秒到幾分鐘)才能得出解決方案。

給定一個提示後,雙子座 2.0 快速思維實驗系統會暫停一下再做出反應,同時考慮一些相關的提示,並沿途解釋其推理過程。 一段時間後,模型會總結出它認為最準確的答案。

Google的推理模型有時會在計算字母上遇到困難。圖片來源:Google

在OpenAI o1 發佈之後,不僅是Google,其他競爭對手的人工智慧實驗室也紛紛推出了推理模型。 11 月初,由量化交易員資助的人工智慧研究公司 DeepSeek 推出了其首個推理模型的預覽版DeepSeek-R1。 同月,阿里巴巴的 Qwen 團隊 發佈了 它聲稱這是 o1 的第一個"開放"挑戰者。

彭博社在 10 月份報導,Google有幾個團隊正在開發推理模型。 隨後,The Information在 11 月份的報導顯示,該公司至少有 200 名研究人員專注於這項技術。

並不是每個人都相信推理模型是最好的發展方向。 首先,由於運行推理模型需要大量的計算能力,因此推理模型往往價格昂貴。 雖然到目前為止推理模型在基準測試中表現出色,但推理模型能否保持目前的發展速度還很不確定。

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則