首頁 robots.txt robots.txt 的最新熱門文章 新聞 robots.txt 的混亂時代?數百個網站錯誤封鎖AI爬蟲,因為AI公司不斷推出新爬蟲 netizen 發表於 2024年7月31日 09:00 Plurk 數百個網站已將舊的 Anthropic 爬蟲列入黑名單,同時卻沒有封鎖任何新的爬蟲。 新聞 iFixit網站管理員抱怨Claude來抓資料根本是DDoS攻擊,1天超過數百萬次抓取資料訓練AI cnBeta 發表於 2024年7月30日 14:00 Plurk 知名維修網站iFixit抱怨Claude發起DDoS攻擊 1天訪問數百萬次抓取資料訓練AI 新聞 從 robots.txt 到壟斷!Reddit 封鎖爬蟲,Google 則花6000萬美元獨佔 Reddit 搜尋結果 netizen 發表於 2024年7月26日 13:00 Plurk DuckDuckGo、Bing、Mojeek 等其他搜尋引擎不再出現完整的 Reddit 搜尋結果。 新聞 AI 訓練資料告急!網路內容限制引發同意危機 netizen 發表於 2024年7月22日 13:00 Plurk 資料供應計畫 (Data Provenance Initiative) 的新研究發現,可用於構建人工智慧 (AI) 的內容急劇下降。 新聞 Cloudflare 推出一鍵封鎖AI爬蟲機器人的功能,保護網站內容免遭盜用 netizen 發表於 2024年7月05日 12:00 Plurk Cloudflare向其網站託管客戶提供了一種方法,可以阻止AI機器人未經許可抓取網站內容並將數據用於訓練機器學習模型。 上一頁1下一頁
新聞 robots.txt 的混亂時代?數百個網站錯誤封鎖AI爬蟲,因為AI公司不斷推出新爬蟲 netizen 發表於 2024年7月31日 09:00 Plurk 數百個網站已將舊的 Anthropic 爬蟲列入黑名單,同時卻沒有封鎖任何新的爬蟲。
新聞 iFixit網站管理員抱怨Claude來抓資料根本是DDoS攻擊,1天超過數百萬次抓取資料訓練AI cnBeta 發表於 2024年7月30日 14:00 Plurk 知名維修網站iFixit抱怨Claude發起DDoS攻擊 1天訪問數百萬次抓取資料訓練AI
新聞 從 robots.txt 到壟斷!Reddit 封鎖爬蟲,Google 則花6000萬美元獨佔 Reddit 搜尋結果 netizen 發表於 2024年7月26日 13:00 Plurk DuckDuckGo、Bing、Mojeek 等其他搜尋引擎不再出現完整的 Reddit 搜尋結果。
新聞 AI 訓練資料告急!網路內容限制引發同意危機 netizen 發表於 2024年7月22日 13:00 Plurk 資料供應計畫 (Data Provenance Initiative) 的新研究發現,可用於構建人工智慧 (AI) 的內容急劇下降。
新聞 Cloudflare 推出一鍵封鎖AI爬蟲機器人的功能,保護網站內容免遭盜用 netizen 發表於 2024年7月05日 12:00 Plurk Cloudflare向其網站託管客戶提供了一種方法,可以阻止AI機器人未經許可抓取網站內容並將數據用於訓練機器學習模型。