FB 建議貼文

選取貼文複製成功(包含文章連結)!

OpenAI 發表全新 AI 模型 o3:可「用圖像思考」,理解手繪草圖與圖表資訊

OpenAI 發表全新 AI 模型 o3:可「用圖像思考」,理解手繪草圖與圖表資訊

OpenAI 宣布推出旗下最新一代推理型人工智慧模型 o3,具備分析圖像的能力,能夠理解如白板筆記、草圖、圖表等視覺內容,甚至能將這些圖像納入推理過程中。這意味著 AI 不再只是「看懂圖」,而是能真正「用圖像進行思考」。

o3 與 o4-mini 同步登場,進一步整合 ChatGPT 多種工具

與 o3 一同發表的,還有運算效能較輕巧、反應速度更快的 o4-mini 模型。兩款模型已針對數學、程式編碼、科學推理與圖像理解進行最佳化,並可讓 ChatGPT 用戶上傳圖像供 AI 分析討論,甚至進行旋轉、縮放與視覺標註等操作。

根據 OpenAI 說法,o3 是首批能同時調用 ChatGPT 所有工具 的模型,包括:

  • 網頁搜尋工具(Browse)

  • Python 程式執行環境(Code Interpreter)

  • 圖像理解與圖像生成(DALL·E)

這些能力的結合,使 AI 能獨立處理多步驟、跨模態的複雜任務,朝向具備主動決策能力的「AI 代理人」邁進。

圖像理解進化:從「看圖」到「融入推理鏈」

OpenAI 強調,這些模型的進展不只是能看懂圖像,更能將視覺資訊納入邏輯推理流程中。這種「圖像思考」能力,對於科學研究、工程設計、教育應用、甚至創意產業來說,都將開啟更多想像空間。

舉例來說,使用者可上傳一張數學草圖、流程圖或白板筆記,讓 AI 不僅描述圖中內容,還能進一步針對邏輯進行解釋與延伸討論。

OpenAI 發表全新 AI 模型 o3:可「用圖像思考」,理解手繪草圖與圖表資訊

目前已開放給 ChatGPT Plus、Pro 與 Team 用戶

從本週三起,o3 與 o4-mini 已開放給 ChatGPT Plus(每月 20 美元)、Pro 與企業級 Team 用戶使用。Free 用戶則尚未支援。

此外,OpenAI 也再次被問到命名問題,CEO 山姆・奧特曼(Sam Altman)笑稱:「我們夏天前會處理命名問題,之後大家有幾個月可以盡情吐槽我們,這是我們活該的。」

OpenAI 發表全新 AI 模型 o3:可「用圖像思考」,理解手繪草圖與圖表資訊

安全機制更新惹議,OpenAI 表示「保留應變權利」

針對近期 AI 安全爭議,OpenAI 表示 o3 與 o4-mini 都經過公司史上最嚴格的安全測試,並採用新版「準備框架(Preparedness Framework)」。但同時,OpenAI 也修改了部分政策,例如不再為部分微調模型進行預先測試,並未對最新 GPT-4.1 模型發布詳細的模型卡(model card)文件,引起部分社群關注。

該公司補充指出,若有其他公司推出高風險且缺乏安全機制的 AI 系統,OpenAI 保留調整自家安全政策的彈性空間。

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
林老師
2.  林老師 (發表於 2025年4月18日 14:08)
OpenAI 最新推出的 o3 模型具備先進的多模態推理能力,能將圖像直接納入思考流程,實現視覺與語言的深度整合。​這項技術在處理複雜問題時展現出色的表現,特別是在需要圖文結合的任務中。​然而,隨著 AI 技術的迅速發展,市場上也出現了以「百家樂攻略」為名的詐騙資訊,利用 AI 的名義誤導消費者。​因此,使用者在尋求相關策略時,應提高警覺,選擇可信賴的來源,以避免受到不實資訊的影響。
發表回應
謹慎發言,尊重彼此。按此展開留言規則