史丹佛的PIGEON新AI模型可以只靠一張照片,不靠GPS資訊也能推理出你所在位置

史丹佛的PIGEON新AI模型可以只靠一張照片,不靠GPS資訊也能推理出你所在位置

通過照片來進行定位在以前是個很好玩的事情,比如有些網友就可以透過收到網友發來的照片,根據照片中的光線、地理結構、店舖招牌等資訊來定點陣圖片中的位置在哪。對大多數使用者來說從照片裡進行定位是個略微有些難度的事情,但以後,通過 AI 來識別那就是個非常簡簡單單的活兒了。

GeoGuessr 是一個地理位置發現網頁遊戲,遊戲會將玩家放置到一個半隨機的Google街景地點,要求玩家只通過可見的線索來猜測他們在世界上的位置。

這個遊戲裡有個著名的玩家叫 Trevor Rainbolt,史丹佛大學新的 AI 模型就拿這名玩家當作對手來練習,進行六次對戰後 AI 完勝。

史丹佛的PIGEON新AI模型可以只靠一張照片,不靠GPS資訊也能推理出你所在位置

史丹佛大學一群研究生推出的這個應用程式名為預測圖像地理位置 (PIGEON),該應用背後使用他們自己訓練的 AI 模型進行驅動,而 AI 模型又通過 OPENAI CLIP 神經網路進行處理,可以將文字連結到圖像。

PIGEON 的原理是利用Google街景功能以及其他公開的圖片來對比使用者拍攝的照片,在以前靠人工比對是個辛苦活,但現在 AI 可以快速搞定定位。

基準測試顯示 PIGEON 的精準率為 92%,還可以在 40% 的猜測中獎位置範圍縮小到 25 公里的範圍。所以一經上線測試 PIGEON 就打敗了 GeoGuessr 上的大部分玩家,成為排名前 0.01% 的 “玩家”。

訓練:

根據團隊的說明,在 PIGEON 開始時,他們使用了來自 GeoGuessr 的 10 萬個隨機採樣的原始位置進行訓練,之後還嚇著了四張圖像來涵蓋給定位置的整個全景,相當於 40 萬張圖片。

同時項目團隊還建立了大約包含 50 萬張街景圖像的資料集,實際上整個資料集的規模並不算大,但訓練出來的 AI 模型表現已經很不錯。

隱私:

如果是其他 AI 模型,或許這時候就可以直接發佈模型供愛好者玩耍了,但這個 AI 模型存在潛在的隱私問題,因為它可以被犯罪分子用來定位某些使用者。

比如某使用者在社群網路上發佈了一張隨手拍的照片,那麼犯罪分子就可以通過 AI 模型來找到這種照片的大概位置,進而知道這名使用者的位置。

項目團隊強調,該應用程式在自動駕駛、視覺調查、安全等方面可以成為一種有效的工具,然而如果落入壞人之手,並被用於非預期目的的不良用途,則潛在的危害令人高度擔憂。

因此項目團隊決定不公開此 AI 模型、僅出於學術目的共享程式碼。

論文地址:https://arxiv.org/pdf/2307.05845.pdf

 

 

36Kr
作者

36氪(36Kr.com)累計發表超過10.8萬條包含圖文、音訊、影片在內的優質內容。氪原創內容體系涵蓋新創公司、大公司、投資機構、地方產業與二級市場等內容模組,設置有快訊、深度商業報導

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則