meta涉嫌版權侵權,使用LibGen數據集訓練AI并刪除版權信息
meta正面臨一起涉及版權侵權的訴訟,原告律師稱,meta首席執行官馬克·扎克伯格批準公司使用盜版電子書和文章的數據集來訓練其Llama AI模型。該案件是針對多家科技巨頭的眾多版權訴訟之一,這些公司被指控在未獲授權的情況下使用受版權保護的作品進行AI模型訓練。
在周三晚間提交給美國加利福尼亞北區地方法院的文件中,原告重申了 meta去年年底的證詞,證詞中透露扎克伯格批準使用名為LibGen的數據集來進行與Llama相關的訓練。LibGen被視為一個“鏈接聚合器”,提供大量受版權保護的學術出版物。盡管該網站因侵犯版權而多次遭到起訴和勒令關閉,但它依然持續提供來自Cengage Learning、McGraw Hill等大型出版商的作品。
文件中提到,meta內部有員工承認,LibGen是一個“我們知道是盜版的數據集”,并表示其使用可能會對公司與監管機構的談判地位產生負面影響。尤其令人關注的是,meta工程師Nikolay Bashlykov被指控編寫腳本,刪除LibGen電子書中的版權信息,包括“版權”和“致謝”字樣。meta還據稱從科學期刊文章中刪除了版權標記和源元數據,以掩蓋其侵權行為。
更具爭議的是,meta被指控通過torrenting方式下載LibGen內容,并幫助傳播這些被盜版權的文件。torrenting是一種在網絡上分發文件的方式,其中下載者在同時上傳文件的同時共享內容。原告律師表示,meta通過參與torrenting實際上實施了另一種形式的版權侵權行為。盡管meta工程師對此提出保留意見,認為這一行為不合法,meta依然在生成AI負責人Ahmad Al-Dahle的支持下繼續進行這一行為。
這些指控顯然與《紐約時報》去年4月的報道相符,后者曾暗示meta在收集人工智能數據時采取了偷工減料的做法。據報道,meta曾雇傭非洲承包商匯總書籍摘要,并曾考慮收購出版商西蒙舒斯特。然而,meta高管認為談判版權許可需要過長時間,合理使用原則成為了他們的主要辯護理由。
中企檢測認證網提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產權貫標一站式行業企業服務平臺。中企檢測認證網為檢測行業相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業性問題可以撥打中企檢測認證網在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產權、版權法律法規知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網絡信息技術檢測、環境檢測、管理體系認證、服務體系認證、產品認證、版權登記、專利申請、知識產權、檢測法、認證標準等信息,中企檢測認證網為檢測認證商標專利從業者提供多種檢測、認證、知識產權、版權、商標、專利的轉讓代理查詢法律法規,咨詢輔導等知識。
本文內容整合網站:中國政府網、百度百科、搜狗百科、360百科、知乎、市場監督總局 、國家知識產權局
免責聲明:本文部分內容根據網絡信息整理,文章版權歸原作者所有。向原作者致敬!發布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯系刪除并致歉!