
由馬斯克創立的人工智慧公司 xAI,於本週二正式宣布推出全新功能 Grok Vision,讓旗下 AI 聊天機器人 Grok 能夠透過相機「看見」現實中的物品、文字與標誌,並即時回應使用者的提問。
Grok Vision:AI 的「視覺能力」初登場
Grok Vision 可透過 iOS 裝置的 Grok 應用程式啟用,用戶只需將手機對準商品、標籤、文件或其他實體物件,便可向 Grok 詢問相關資訊。這項功能讓聊天機器人的應用場景更貼近生活,例如識別菜單、閱讀說明書、解釋 QR code 標誌等。
GROK CAN SEE WHAT YOU SEE—LITERALLY
— Mario Nawfal (@MarioNawfal) April 20, 2025
Grok’s voice mode comes with camera access, letting users point their phone at something and ask, “What am I looking at?”
The Vision feature on iOS allows the chatbot to analyze real-world objects, text, and environments through your… https://t.co/cmtINP8yp6 pic.twitter.com/N1b6pcYZOi
這功能其實有點類似Google Lens的AI版,Grok Vision 可以隨著鏡頭的變化跟你互動。其實仔細想想這功能與自動駕駛的視覺功能似乎有點像,畢竟同家族特斯拉的自動駕駛功能已經發展那麼久了,視覺功能是Grok的強項也該是意料之中。
目前 Android 用戶尚未能使用 Grok Vision,xAI 表示尚在開發中。
多語音輸出、即時搜尋功能同步上線
除視覺功能外,xAI 也同步為 Android 用戶推出兩項新功能:
-
多語言語音輸出支援
-
Grok 語音模式下的即時搜尋功能
不過,這兩項服務僅限訂閱 每月 30 美元的 SuperGrok 套餐 的用戶使用。雖然 Grok 基礎版已具備基本對話與搜尋功能,但要享受完整體驗,仍需付費升級。
Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.
— Ebby Amir (@ebbyamir) April 22, 2025
Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5
Grok 穩步升級,功能快速擴展
xAI 近期持續為 Grok 擴充功能。本月稍早,Grok 增加了「記憶系統」,可根據使用者過去的對話內容提供更具脈絡性的回答。此外,xAI 還推出「工作空間」創作工具,讓使用者可透過 Grok 協助撰寫文件或打造簡易應用程式。
這些新功能讓 Grok 不僅僅是聊天機器人,更朝向「多模態 AI 助理」的方向發展。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!