近日,一名圖書作者對社交巨頭Meta提出了指控,聲稱該公司未經授權下載了大量的盜版電子書,用以訓練其人工智能模型。根據最新的證據揭示,Meta的盜版行為規模之大令人震驚。
據指控,Meta通過名為“安娜的檔案”(Annas Archive)的渠道,下載了至少81.7 TB的數據。這些數據中包含了來自知名盜版網站Z-Library和LibGen的至少35.7 TB的內容。值得注意的是,“安娜的檔案”是一個包含了Z-Lib、Sci-Hub和LibGen鏡像站點的平臺。此外,Meta還被指從LibGen下載了額外的80.6 TB數據。
圖書作者指出,Meta的這一行為構成了非法的電子書庫種子下載,而且這一數字可能只是其盜版行為的冰山一角。作者估計,這些盜版電子書庫可能僅占Meta盜版版權作品總量的0.008%,這一比例表明Meta的盜版規模可能遠超目前所揭露的。
這一指控引發了公眾對大型科技公司版權問題的關注,尤其是它們在訓練AI模型時使用的數據來源。如果指控成立,Meta可能面臨嚴重的法律后果,包括版權侵犯的訴訟和可能的罰款。這也可能促使相關部門加強對科技公司數據使用合規性的監管。