ADVERTISEMENT
今年一月,Meta被一群作家告上法院,指控他們使用盜版的書籍來訓練他們的AI系統,而且還是Mark Zuckerberg批准的。而最新的進展是,新公開的Meta內部電子郵件顯示出更多內部員工透過BT下載盜版書籍的證據。
這些郵件內容顯示,Meta 公司內部早已知悉並承認,他們曾大規模下載一個名為 LibGen 的備受爭議的數據集。LibGen 以收錄數千萬本盜版書籍而聞名。根據作家們提交給法院的文件指出,Meta 透過 Anna's Archive 網站,從多個影子圖書館非法下載了至少 81.7 TB 的龐大數據,其中光是來自 Z-Library 和 LibGen 這兩個盜版電子書平台的數據,就高達 35.7 TB。此外,Meta 公司過去也曾從 LibGen 下載過 80.6 TB 的數據。
原告作家們痛批 Meta 公司的非法盜版計畫規模之龐大,令人咋舌。他們更指出,「即使是規模遠小於 Meta 盜版侵權作品數量的 0.008% 的數據盜版行為,都曾導致法官將該行為移交美國檢察官辦公室進行刑事調查」。Meta 的盜版行徑,可見其情節之嚴重。
ADVERTISEMENT
更令人震驚的是,洩露的郵件內容顯示,Meta 公司內部員工也清楚意識到其行為所潛藏的法律風險。早在 2023 年 4 月,Meta 公司的研究工程師尼古拉-巴什利科夫 (Nikolay Bashlykov) 就曾在一封郵件中寫道:「用公司的筆記型電腦下載 BT 感覺不太妥當。」(Using company laptops for BT feels wrong.) BT 指的是 BitTorrent,一種常見的 P2P 檔案分享協定,常被用於非法下載盜版內容。
到了 2023 年 9 月,巴什利科夫對於公司公然遊走法律邊緣的行徑,顯然感到更加不安,並主動諮詢了公司法律團隊的意見。他在郵件中明確指出:「使用 Torrents 意味著對檔案進行『播種』(seeding),也就是對外共享內容。這在法律上是不被允許的。」(Using Torrents means 'seeding' files, i.e. sharing content to the outside. This is legally not allowed.)
ADVERTISEMENT
儘管公司內部早已響起警鐘,但原告作家們認為,Meta 公司最終仍然選擇無視法律風險,持續進行其非法盜版計畫。更甚者,Meta 還試圖掩蓋其「播種」活動,並調整相關設定,盡可能減少「播種」行為,以規避法律責任。據稱,Meta 甚至還嘗試將數據集下載到非 Meta 伺服器,藉此逃避被追蹤的風險,避免任何人從 Meta 伺服器「追溯播種者/下載者」(trace seeders/downloaders)。
隨著這些新的證據的曝光,作者們聲稱,參與決定下載LibGen的Meta員工必須再次接受質詢,因為據稱新的事實「與之前的證詞相矛盾」。
例如,Mark Zuckerberg曾聲稱自己並未參與使用LibGen訓練AI模型的決策。但新的證據顯示,「使用LibGen的決定是在“事先上報給MZ(Mark Zuckerberg)”之後做出的,」作者們指控。
ADVERTISEMENT
Meta目前在整個訴訟過程中堅持認為使用LibGen進行AI訓練屬於“合理使用”。
ADVERTISEMENT