驗證碼浪費用戶數十億小時?研究揭開reCAPTCHA背後真相:幫Google賺錢

驗證碼浪費用戶數十億小時?研究揭開reCAPTCHA背後真相:幫Google賺錢

爾灣加州大學於2023年進行的一項研究《關於reCAPTCHAv2的大規模真實用戶研究》得出結論,驗證碼不僅在實際阻止機器人流量方面效果不佳,還通過追蹤cookie引發隱私問題,浪費了我們大家總計數十億小時的時間,並且為Google生成了價值近萬億美元的數據。Google早在2009年就收購了廣泛使用的reCAPTCHA工具。

該研究聚焦於通過Google reCAPTCHAv2在現實中最常見的兩種驗證碼形式:「隱形」或基於行為的驗證碼,當你勾選「我不是機器人」框時,甚至在你瀏覽網站時,它會暗中分析你的輸入;還有基於圖像的驗證碼,你需要從Google街景獲取的圖片中選擇所有摩托車、交通信號燈之類的內容。

這兩種驗證碼對Google都很有價值,前者生成的追蹤cookie可能有助於廣告定向投放,而後者則可用於Google內部的人工智慧模型訓練,或者出售給其他公司。

驗證碼浪費用戶數十億小時?研究揭開reCAPTCHA背後真相:幫Google賺錢

無意義的驗證碼

這項實驗並未告知實驗對象,而是將Google的reCAPTCHAv2添加到該大學內部學生帳戶系統的帳戶創建和密碼找回功能中,研究人員既測量完成驗證碼所需的時間,又對這項為期13個月的研究中的3600名用戶進行抽樣調查,了解他們的體驗。不出所料,當涉及到更複雜的圖像識別驗證碼時,用戶花費的時間更多,反應也多為負面。該研究還指出,完成時間會因學科、經驗以及是創建帳戶還是找回帳戶而有所不同。

研究人員算出圖像和行為驗證碼的平均完成時間為3.53秒,並將其與2010年至2023年間網際網路上完成的5120億個reCAPTCHAv1和v2驗證碼的低端估計數相乘,得出了以下關於驗證碼對我們生活影響的估算結果:

  • 花費8.19億小時來完成驗證碼。

  • 按美國聯邦最低工資標準計算,這些時間價值約61億美元(約新台幣2740億元)。

  • 消耗134PB的網路頻寬。

  • 耗費750萬千瓦時的能源。

  • 產生750萬磅的二氧化碳污染。

這是補充的資料:將8.19億小時與人類平均壽命79年相比,相當於耗費了1182.7個人的一生來完成驗證碼。

機器人的效率更高

將這項新研究中人類完成驗證碼的時間和準確率與機器人進行對比,同時參考以往關於自動化程式破解驗證碼能力不斷提高的研究,研究人員得出結論,如今機器人完成reCAPTCHAv2複選框的速度比人類快。

而在圖像識別方面,雖然機器人花費的時間更多,但準確率更高。研究人員還認為,追蹤cookie實際上帶來了新的安全和隱私風險。根據Google公布的已標註圖像識別資料集合的價值,以及單個追蹤cookie的終身價值乘以估算的2010年至2023年間完成的reCAPTCHAv2總量,得出了以下對Google來說的價值估算:

  • 其完整的reCAPTCHA資料集價值87.5億 - 323億美元(約新台幣3940億元至1454億元),理論上該數據集可多次出售給不同的供應商。

  • 2010年至2023年間reCAPTCHAv2產生的所有追蹤cookie的終身價值為8880億美元(約新台幣3兆9956億元)。

研究人員在研究的最後部分指出:「可以得出結論,reCAPTCHAv2的真正目的是作為一個偽裝成安全服務的追蹤cookie生成場來盈利。」他們認為,由於reCAPTCHA對網際網路安全或功能並無實際貢獻,應該逐步淘汰。然而,這項研究過去兩年了,短期內仍沒有淘汰的跡象。

 

NetEase
作者

網易科技,有態度的科技門戶!關注微信公眾號(tech_163),看有態度的深度內容。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則