
OpenAI 宣布推出旗下最新一代推理型人工智慧模型 o3,具備分析圖像的能力,能夠理解如白板筆記、草圖、圖表等視覺內容,甚至能將這些圖像納入推理過程中。這意味著 AI 不再只是「看懂圖」,而是能真正「用圖像進行思考」。
o3 與 o4-mini 同步登場,進一步整合 ChatGPT 多種工具
與 o3 一同發表的,還有運算效能較輕巧、反應速度更快的 o4-mini 模型。兩款模型已針對數學、程式編碼、科學推理與圖像理解進行最佳化,並可讓 ChatGPT 用戶上傳圖像供 AI 分析討論,甚至進行旋轉、縮放與視覺標註等操作。
根據 OpenAI 說法,o3 是首批能同時調用 ChatGPT 所有工具 的模型,包括:
-
網頁搜尋工具(Browse)
-
Python 程式執行環境(Code Interpreter)
-
圖像理解與圖像生成(DALL·E)
這些能力的結合,使 AI 能獨立處理多步驟、跨模態的複雜任務,朝向具備主動決策能力的「AI 代理人」邁進。
圖像理解進化:從「看圖」到「融入推理鏈」
OpenAI 強調,這些模型的進展不只是能看懂圖像,更能將視覺資訊納入邏輯推理流程中。這種「圖像思考」能力,對於科學研究、工程設計、教育應用、甚至創意產業來說,都將開啟更多想像空間。
舉例來說,使用者可上傳一張數學草圖、流程圖或白板筆記,讓 AI 不僅描述圖中內容,還能進一步針對邏輯進行解釋與延伸討論。
目前已開放給 ChatGPT Plus、Pro 與 Team 用戶
從本週三起,o3 與 o4-mini 已開放給 ChatGPT Plus(每月 20 美元)、Pro 與企業級 Team 用戶使用。Free 用戶則尚未支援。
此外,OpenAI 也再次被問到命名問題,CEO 山姆・奧特曼(Sam Altman)笑稱:「我們夏天前會處理命名問題,之後大家有幾個月可以盡情吐槽我們,這是我們活該的。」
安全機制更新惹議,OpenAI 表示「保留應變權利」
針對近期 AI 安全爭議,OpenAI 表示 o3 與 o4-mini 都經過公司史上最嚴格的安全測試,並採用新版「準備框架(Preparedness Framework)」。但同時,OpenAI 也修改了部分政策,例如不再為部分微調模型進行預先測試,並未對最新 GPT-4.1 模型發布詳細的模型卡(model card)文件,引起部分社群關注。
該公司補充指出,若有其他公司推出高風險且缺乏安全機制的 AI 系統,OpenAI 保留調整自家安全政策的彈性空間。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!