
在人工智慧(AI)領域的激烈競逐中,Google 持續展現其領先地位。近日,Google 宣布 Gemini 推出兩項由「Project Astra」支援的全新功能:螢幕閱讀和即時影像解讀,為使用者帶來更智慧、更直覺的互動體驗。這兩項功能不僅提升了 Gemini 的實用性,更預示著 AI 助理正朝向更個人化、更具情境感知能力的時代邁進。
Gemini 新功能:資訊無障礙與生活智慧的雙重提升
Gemini 的螢幕閱讀功能,讓 AI 助理能夠讀取螢幕上的內容,並提供相關資訊或協助。這項功能對於視障人士或需要更便利資訊獲取方式的使用者來說,無疑是一大福音。想像一下,當你在瀏覽外文網頁時,Gemini 可以即時翻譯螢幕上的文字,省去複製貼上的麻煩;當你在使用複雜的應用程式時,Gemini 可以提供操作指引,讓你輕鬆上手。這項功能不僅提升了資訊的可及性,更讓 AI 助理成為真正的個人化輔助工具。
另一項令人期待的功能是即時影像解讀。這項功能讓 Gemini live能夠分析智慧型手機相機所拍攝的畫面,並回答使用者的相關問題。Google 在示範影片中展示了這項功能的應用場景:使用者可以透過 Gemini 尋求建議,例如為新上釉的陶器選擇合適的顏料。這項功能不僅能提供即時的資訊,還能作為生活中的 AI 顧問,協助使用者解決各種問題。無論是辨識植物種類、翻譯路標文字,或是提供購物建議,Gemini 都能成為你生活中的得力助手。
目前僅有國外少部分用戶表示已經在它們手機的App中可以看到這個功能,因此可能這功能正陸續推動開放中。
AI 助理時代的競爭與變革
隨著 AI 技術的快速發展,AI 助理已成為科技巨頭們爭奪的焦點。除了 Google 的 Gemini 之外,Amazon 正在準備推出 Alexa Plus 升級版的有限早期試用,而 Apple 則延後了其升級版 Siri 的發布。微軟則是專注在推動他們自家的Copilot。這些產品的功能預計將與 Gemini 現在開始啟用的功能類似。儘管三星仍然擁有 Bixby,但 Gemini 仍然是其手機上的預設助理。這場 AI 助理競賽,將為使用者帶來更多創新和便利。
然而,AI 助理的發展並不僅僅是功能的堆疊,更重要的是如何將 AI 融入使用者的生活,意味著 AI 能夠理解使用者的意圖,主動提供協助,並與使用者協同完成任務。
為了實現 Copilot 的願景,科技巨頭們正在積極開發各種新技術。例如,Google 的 Project Astra 旨在打造一個能夠理解使用者意圖、並與使用者進行自然對話的多模態虛擬助理。Amazon 也在積極開發能夠理解人類情感的 AI 助理,讓 AI 助理能夠更好地與使用者互動。Apple 則在努力提升 Siri 的自然語言處理能力,讓 Siri 能夠更準確地理解使用者的指令。
然而,AI 助理的發展也面臨著一些挑戰。例如,如何保護使用者的隱私、如何避免 AI 助理產生偏見、如何確保 AI 助理的安全可靠等等。這些問題需要科技巨頭們共同努力解決,才能讓 AI 助理真正成為人類的 Copilot,為人類帶來福祉。
文章提到 Google Gemini AI 將與 Microsoft Copilot 競爭,但未分析 Gemini 在資料隱私與本地運算上的優勢。目前,AI 助手的安全性與透明度成為關鍵,這就像北京賽車詐騙事件,若不審慎選擇可靠平台,可能會面臨資料外洩與不透明機制的風險。建議作者補充 Gemini 在隱私保護與運算技術上的優勢,讓讀者能更理性評估其市場競爭力。