這家咖啡廳裡,顧客待了多長時間,店員做了幾杯咖啡,在AI鏡頭下一清二楚。百萬網友圍觀稱太可怕,馬斯克都震驚了。我們生活的世界,越來越沒有隱私。網上流出的這段影片,把許多人都嚇到了。
在一個咖啡店裡,每個顧客進店待了幾分鐘,每個服務員給顧客端了幾杯咖啡,都顯示得一清二楚!
影片發佈才十幾個小時,已經有100多萬網友圍觀了。
發佈影片的網友表示:這個概念展示了咖啡店是如何使用AI分析咖啡師和顧客的。請在咖啡店充分「享受」您的隱私吧!
This concept shows how a coffee shop ☕️ can use AI to analyze baristas and customers.
— Lukas Benzl (@lukasbenzlcom) August 18, 2023
Enjoy your Double Chocolate Chip Frappuccino and privacy while there is time. 😅 pic.twitter.com/M8NXdvlj5I
另一位網友表示,這沒什麼大驚小怪的。作為消費者,你應該知道很多商店在你進去的一瞬間,就對你的一切瞭如指掌。
連馬斯克本人都現身留言區,連續留下了兩個驚嘆號。
如果你覺得在咖啡館裡用AI監視員工和顧客已經夠可怕了,現實就是,如果不考慮成本,空中可以有數千架無人機向監管部門傳送即時跟蹤資料,一切都會被跟蹤和記錄。
甚至不需要專業部門,任何人都可以在業餘無人機上進行跟蹤,因為目前的物體檢測和圖像識別技術實在太強大了。
要知道,幾年前在獨立顯示卡上運行1080p串流時,最大容量也不過就是6個對象。
無處不在的「眼睛」
現實就是,我們現在的世界,到處都是鏡頭。
其中,已經有不少企業部署了非常隱蔽的策略,用於追蹤消費者,一切都是通過AI和影片源上的視覺識別來完成的。
比如沃爾瑪的智慧零售實驗室內,IRL感測器和鏡頭,讓工作人員對店裡的一切都瞭如指掌。
快餐店也採用了AI技術進行員工監督。這裡規定員工必須戴口罩,如果誰摘下口罩,經理就會立刻知道。
另外,我們的移動位置資料也在被待價而沽。
幾乎所有手機電信商,都在匿名向零售店售賣資料,可以說這是他們的一部分核心業務。
只要Google一下電信商名稱+crowd insights(人群洞察),得到的結果就會令你驚訝。
想知道特定時間內經過特定地點的人群數量是多少嗎?他們的年齡、收入狀況怎樣,有多少能夠成為潛在客戶?
當然,人群洞察服務會強調:資料都是匿名的,收據收集的方式並不會暴露個人隱私。
有人表示:既然我的資料被收集了,我可以要求企業向我付費嗎?
關於企業中採用的鏡頭,留言區有人現身說法——
「我在體育場的後端安全鏡頭系統工作,我們向公眾發佈的內容,只有實際資料的1/3。」
「這簡直就像在電影中,把自己的臉輸進去,系統就會識別出你在哪裡。」
而實現這一切,你只需要利用鏡頭,安裝一個300美元的軟體,然後開始運行,直到磁碟空間用盡。
AI鏡頭的好處與壞處分別為何?
對此,AI諮詢專家Diego San Esteban分享了自己的觀點:
他認為,AI監測當然有不少優點,比如能持續監控員工的表現和生產力,讓管理人員更好地制定戰略。另外,AI也可以提供客觀的績效資料,避免在評估中出現人為的偏見。
而缺點也不少,最為人詬病的自然是對員工隱私權的侵犯,並且還會在企業內產生不信任的氣氛,影響士氣和工作滿意度。AI也無法充分理解工作進行的背景,還缺乏人類的同理心。並且它很可能會犯錯,受到訓練資料固有的偏見影響,這對員工是極度不公平的。
目標檢測演算法
其實,這次備受爭議的事件背後,就是一種很常見的AI技術——目標檢測。
例如,給定一張城市街道的照片,目標檢測模型將返回圖像中所有不同物體的註釋或標籤列表:交通訊號燈、車輛、道路標誌、建築物等。這些標籤將包含每個物體的適當類別,比如人以及一個邊界框,即完全包含物體的矩形區域。
產業應用
目標檢測對於人類來說是一項關鍵任務:當進入新的房間或場景時,我們的第一反應是對其中的物體和人員進行視覺評估,然後理解它們。
與人類類似,目標檢測在使電腦理解和與視覺世界進行互動方面發揮著至關重要的作用,並且已經在很多行業中得到了廣泛的應用:
場所安全:
目標檢測模型可以幫助提高工作場所的安全性和安全性。例如,它們可以檢測敏感區域中可疑個體或車輛的存在。更具創意性的是,它可以確保工人使用個人防護裝備(PPE),如手套、頭盔或口罩。
社群媒體:
目標檢測模型可以幫助識別數位媒體中特定品牌、產品、標誌或人物的存在。廣告商可以利用這些資訊來收集資料,並向使用者展示更相關的廣告。它還有助於自動化檢測和標記不當或禁止內容的過程。
品質控制:
目標檢測模型實現了對視覺資料的自動化審查。電腦和鏡頭可以即時分析資料,自動檢測和處理視覺資訊並理解其重要性,從而減少了在需要進行持續視覺審查的任務中的人工干預。這在製造生產品質控制方面尤其有用。它不僅提高了效率,還可以檢測到人眼可能忽略的生產異常,從而防止潛在的生產中斷或產品召回。
首次達到66 AP,最強SOTA演算法霸榜
當前,在目標檢測演算法的性能上,DETRs with Collaborative Hybrid Assignments Training,憑藉了高達66 AP的成績霸榜COCO。該工作已經被ICCV 2023錄用。
在論文中,作者提出了一種新穎的協作混合分配訓練方案——Co-DETR,可以從多樣化的標籤分配方式中學習更高效且更有效的基於DETR的檢測器。
通過訓練多個平行輔助頭(受到一對多標籤分配的監督,如ATSS和Faster RCNN),全新的Co-DETR可以輕鬆提升端到端檢測器中編碼器的學習能力。從這些輔助頭中提取正坐標來進行額外的定製正查詢,Co-DETR還可以提高解碼器中正樣本的訓練效率。此外,在推理過程中,這些輔助頭會被丟棄,因此該方法不會給原始檢測器引入額外的參數和計算成本,同時也不需要手工非極大值抑制(NMS)。
編碼器最佳化:
訓練方案可以通過訓練多個平行輔助頭,這些頭通過一對多的標籤分配進行監督,從而輕鬆提升端到端檢測器中編碼器的學習能力。
解碼器最佳化:
通過從這些輔助頭中提取正坐標來進行額外的定製正查詢,來改善解碼器的注意力學習。
SOTA的性能:
搭載ViT-L(304M參數)的Co-DETR是第一個在COCO test-dev上實現66.0% AP的模型。
實驗結果顯示,在Swin-L骨幹網路的基礎上,Co-DETR方法可以將現有的SOTA模型DINO-Deformable-DETR的性能,從58.5%提高到59.5%(在COCO驗證集上)。
在ViT-L骨幹網路的支援下,Co-DETR在COCO test-dev上實現了66.0% AP,以及在LVIS驗證集上實現了67.9% AP。
此外,與以往方法相比,Co-DETR還在模型規模更小的情況下,取得了更好的性能。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!