目的及研究范圍
本報(bào)告由歐盟知識(shí)產(chǎn)權(quán)局(EUIPO)發(fā)布,從技術(shù)視角深入分析生成式人工智能(GenAI)與歐盟著作權(quán)法之間的交匯問題,是其下屬機(jī)構(gòu)歐洲知識(shí)產(chǎn)權(quán)侵權(quán)觀察站(Observatory)的重要研究成果。該觀察站由公共與私營(yíng)領(lǐng)域的專家與專業(yè)機(jī)構(gòu)聯(lián)合協(xié)作組成。
近年來,人工智能(AI)技術(shù),尤其是GenAI的發(fā)展,日益成為公眾關(guān)注與討論的焦點(diǎn)。以大型語言模型(LLMs)為代表的GenAI系統(tǒng),通過分析海量訓(xùn)練數(shù)據(jù)提取規(guī)律,構(gòu)建算法,從而生成具有相似特征的全新內(nèi)容。然而,隨著GenAI的廣泛應(yīng)用,著作權(quán)相關(guān)問題也日益凸顯。盡管這一技術(shù)革新為創(chuàng)意產(chǎn)業(yè)帶來了前所未有的創(chuàng)新潛力和變革機(jī)遇,但其也引發(fā)了與著作權(quán)所有人之間的利益沖突。無論如何,此類技術(shù)的發(fā)展與應(yīng)用仍必須在現(xiàn)行知識(shí)產(chǎn)權(quán)法律框架內(nèi)進(jìn)行,以確保創(chuàng)作者權(quán)益得到有效保護(hù),促進(jìn)技術(shù)與法律的協(xié)調(diào)發(fā)展。
2018年,歐盟委員會(huì)發(fā)布的《歐洲AI戰(zhàn)略》明確提出:“需要從知識(shí)產(chǎn)權(quán)局和用戶的雙重視角,探討AI與知識(shí)產(chǎn)權(quán)的互動(dòng)關(guān)系,以在創(chuàng)新與法律確定性之間實(shí)現(xiàn)平衡。”基于這一戰(zhàn)略,歐盟于2024年6月率先通過全球首部綜合性AI法規(guī)——《人工智能法案》(AI Act,第2024/1689號(hào)),該法案要求在推動(dòng)技術(shù)創(chuàng)新的同時(shí),與現(xiàn)有的知識(shí)產(chǎn)權(quán)保護(hù)法規(guī)(如“文本與數(shù)據(jù)挖掘例外條款”及權(quán)利人的“選擇退出機(jī)制”)有效銜接。
與此同時(shí),GenAI技術(shù)對(duì)歐洲知識(shí)產(chǎn)權(quán)格局的影響,已在EUIPO觀察站內(nèi)的專家小組中展開了深入討論。2022年,EUIPO發(fā)布了《人工智能對(duì)著作權(quán)與外觀設(shè)計(jì)侵權(quán)及執(zhí)法的影響》(Impact of Artificial Intelligence on the Infringement and Enforcement of Copyright and Designs)研究報(bào)告;歐盟委員會(huì)亦同步推出了兩份專題報(bào)告,詳細(xì)探討了AI技術(shù)對(duì)文化創(chuàng)意產(chǎn)業(yè)所帶來的機(jī)遇與挑戰(zhàn)。這一系列的研究討論與立法進(jìn)程相互銜接,共同為本次研究提供了堅(jiān)實(shí)的基礎(chǔ)。
鑒于上述背景,EUIPO觀察站委托本研究從“解決方案導(dǎo)向”的視角,深入分析著作權(quán)法在GenAI系統(tǒng)發(fā)展過程中所面臨的關(guān)鍵技術(shù)問題與應(yīng)對(duì)路徑。本報(bào)告旨在為相關(guān)利益方提供政策建議與實(shí)踐指引,并與歐盟委員會(huì)人工智能辦公室及著作權(quán)事務(wù)部門的工作形成有益補(bǔ)充與協(xié)同支持。根據(jù)觀察站2025年工作計(jì)劃,EUIPO還將探索開發(fā)一項(xiàng)“選擇退出機(jī)制服務(wù)”,以進(jìn)一步平衡著作權(quán)持有者與人工智能開發(fā)企業(yè)之間的權(quán)利與利益關(guān)系。
核心研究目標(biāo)
輸入階段:分析當(dāng)前在GenAI訓(xùn)練過程中,用于限制、授權(quán)或保留受著作權(quán)保護(hù)作品作為訓(xùn)練數(shù)據(jù)的技術(shù)手段與實(shí)踐;
輸出階段:研究用于識(shí)別AI生成內(nèi)容以及防止生成侵權(quán)內(nèi)容的相關(guān)技術(shù)手段與實(shí)踐。
研究范圍
本研究涵蓋GenAI相關(guān)的技術(shù)、法律及市場(chǎng)發(fā)展背景分析,重點(diǎn)關(guān)注其輸入與輸出流程中所涉及的著作權(quán)問題,系統(tǒng)分析AI生態(tài)中各類主體在著作權(quán)管理方面的應(yīng)對(duì)措施。同時(shí),報(bào)告亦探討相關(guān)的經(jīng)濟(jì)影響與制度性考量。
閱讀背景提示
理解本報(bào)告的核心內(nèi)容,需結(jié)合以下三大背景因素:
技術(shù)迭代速度:GenAI技術(shù)的發(fā)展速度遠(yuǎn)超現(xiàn)行法律體系的更新節(jié)奏;
法律地域性差異:歐盟著作權(quán)法律框架在結(jié)構(gòu)與適用上,與其他主要司法轄區(qū)存在顯著差異;
利益平衡難題:如何在鼓勵(lì)技術(shù)創(chuàng)新與有效保護(hù)著作權(quán)之間實(shí)現(xiàn)動(dòng)態(tài)平衡,仍是當(dāng)前政策與實(shí)務(wù)層面面臨的關(guān)鍵挑戰(zhàn)。
執(zhí)行摘要內(nèi)容
過去數(shù)年,人工智能技術(shù)已取得重大突破。隨著LLMs和GenAI的問世,能夠生成文本、代碼、圖像、視頻和音頻內(nèi)容的GenAI服務(wù)已得到廣泛應(yīng)用。這一發(fā)展促使政策制定者和監(jiān)管機(jī)構(gòu)開始審視現(xiàn)有法律框架應(yīng)如何演進(jìn)以應(yīng)對(duì)AI大規(guī)模適用帶來的影響,并在創(chuàng)新與知識(shí)產(chǎn)權(quán)保護(hù)之間尋求平衡。
在此背景下,本研究從歐盟著作權(quán)法視角探討GenAI的發(fā)展態(tài)勢(shì)。報(bào)告包含三大部分:(1)GenAI的技術(shù)、法律與經(jīng)濟(jì)分析,以深入理解GenAI的功能特性及其發(fā)展影響;(2)關(guān)于GenAI服務(wù)開發(fā)過程中使用受著作權(quán)保護(hù)內(nèi)容所面臨的知識(shí)產(chǎn)權(quán)問題;(3)輸出內(nèi)容所面臨的著作權(quán)問題。
(1)技術(shù)、法律與經(jīng)濟(jì)背景
歐盟法律體系中,存在兩部法律文件對(duì)GenAI的發(fā)展將產(chǎn)生著作權(quán)意義上的關(guān)鍵意義:
《數(shù)字單一市場(chǎng)版權(quán)指令》(The Copyright in the Single Market Directive, CDSM指令)就“文本與數(shù)據(jù)挖掘”(Text and Data Mining,TDM)建立了法律框架。作為GenAI模型訓(xùn)練的關(guān)鍵技術(shù)環(huán)節(jié),TDM通過大規(guī)模數(shù)據(jù)采集與分析來優(yōu)化算法參數(shù),這一過程不可避免地涉及對(duì)受著作權(quán)保護(hù)作品的復(fù)制行為。其中, CDSM指令第3條為科研機(jī)構(gòu)創(chuàng)設(shè)了TDM豁免條款,而第4條進(jìn)一步將適用范圍延伸至商業(yè)領(lǐng)域的AI開發(fā)者。特別值得注意的是,第4條例外條款賦予權(quán)利人“選擇退出”(opting-out)TDM例外的權(quán)利——權(quán)利人可通過“機(jī)器可讀方式”(machinereadable means)等適當(dāng)形式明確聲明保留其復(fù)制權(quán)。對(duì)于聲明退出的作品,AI開發(fā)者必須事先取得權(quán)利人的明確授權(quán)(如簽訂著作權(quán)許可協(xié)議)方能合法使用。
《歐盟人工智能法案》(EU Artificial Intelligence Act,AI法案)為AI技術(shù)設(shè)立了一套全面的監(jiān)管框架,其中對(duì)通用人工智能(general–purpose AI ,GPAI)模型提供商設(shè)定了特定義務(wù)。在著作權(quán)領(lǐng)域,這些義務(wù)包括GPAI模型提供商必須遵守CDSM指令第4條關(guān)于TDM選擇退出機(jī)制的規(guī)定。提升透明度,法案強(qiáng)制要求GPAI提供商還需披露訓(xùn)練數(shù)據(jù)的詳盡摘要,以便權(quán)利人行使權(quán)利。該法案同時(shí)要求GenAI系統(tǒng)部署者需確保生成內(nèi)容具有機(jī)器可讀的識(shí)別標(biāo)識(shí)。
權(quán)利人與GenAI系統(tǒng)提供商之間的法律糾紛正在全球范圍內(nèi)日益增長(zhǎng),其中多數(shù)案件發(fā)生在美國。迄今為止,歐盟境內(nèi)已出現(xiàn)四起涉及AI訓(xùn)練與著作權(quán)的訴訟,其中2024年9月德國漢堡地方法院在“Kneschke訴LAION案”中的判決具有標(biāo)志性意義。盡管法院認(rèn)定,LAION(GenAI訓(xùn)練數(shù)據(jù)集的主要提供商)可援引《數(shù)字單一市場(chǎng)版權(quán)指令》第3條的科研例外條款,但判決中的若干附帶意見對(duì)未來法院如何解釋第4條中權(quán)利保留的法律標(biāo)準(zhǔn)提供了重要參考。
與此同時(shí),權(quán)利人與GenAI開發(fā)者之間已就受著作權(quán)保護(hù)內(nèi)容用于AI訓(xùn)練達(dá)成多項(xiàng)高價(jià)值許可協(xié)議。在權(quán)利人有效行使CDSM第4條“選擇退出權(quán)”后,通過直接授權(quán)內(nèi)容使用,可能為其開辟新的收入渠道。本研究識(shí)別并總結(jié)了推動(dòng)此類許可協(xié)議達(dá)成的五大關(guān)鍵因素:1.對(duì)機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)潛在短缺的預(yù)期;2.高質(zhì)量數(shù)據(jù)及其元數(shù)據(jù)標(biāo)注的關(guān)鍵性;3.GenAI開發(fā)者的風(fēng)險(xiǎn)承受能力與其在談判中的相對(duì)議價(jià)地位;4.合成數(shù)據(jù)作為訓(xùn)練輸入的替代潛力;5.面向中小規(guī)模權(quán)利人的內(nèi)容聚合中介服務(wù)的興起,為其進(jìn)入訓(xùn)練數(shù)據(jù)市場(chǎng)提供可行路徑。
盡管不同內(nèi)容領(lǐng)域的直接授權(quán)市場(chǎng)發(fā)展存在差異,但出版行業(yè)——尤其是新聞出版和學(xué)術(shù)出版領(lǐng)域——在授權(quán)使用與檢索增強(qiáng)生成(RAG,詳見GenAI輸出部分)技術(shù)相關(guān)內(nèi)容方面展現(xiàn)出獨(dú)特優(yōu)勢(shì)。此類技術(shù)對(duì)于某些GenAI服務(wù)的開發(fā)至關(guān)重要。
本研究還識(shí)別出可能影響直接授權(quán)條款設(shè)計(jì)的五大關(guān)鍵因素:1.基準(zhǔn)市場(chǎng)費(fèi)率的形成機(jī)制;2.報(bào)酬計(jì)算指標(biāo)的設(shè)定方式;3.授權(quán)類型的創(chuàng)新實(shí)踐;4.將訓(xùn)練輸入與生成輸出結(jié)果相掛鉤的聯(lián)動(dòng)式授權(quán)機(jī)制;5.基于內(nèi)容資產(chǎn)的互惠互利式商業(yè)交換安排。
此外,報(bào)告指出一個(gè)正在引發(fā)關(guān)注的新興問題,即《CDSM指令》第3條所規(guī)定的“科研用途TDM例外”與第4條下的“商業(yè)用途AI訓(xùn)練”之間,可能存在“數(shù)據(jù)洗白”問題。
一個(gè)新興問題是《CDSM指令》第3條規(guī)定的科研用途TDM活動(dòng)與第4條商業(yè)AI訓(xùn)練TDM活動(dòng)之間可能產(chǎn)生的"數(shù)據(jù)洗白"現(xiàn)象。具體而言,部分科研機(jī)構(gòu)在第3條授權(quán)范圍內(nèi)構(gòu)建的數(shù)據(jù)集,后續(xù)若被商業(yè)AI開發(fā)者用于訓(xùn)練目的,可能導(dǎo)致科研例外被規(guī)避性用于商業(yè)應(yīng)用,從而引發(fā)對(duì)科研豁免調(diào)控濫用的擔(dān)憂。
(2)生成式人工智能的輸入環(huán)節(jié)
數(shù)據(jù)收集是GenAI訓(xùn)練的首要環(huán)節(jié),必須遵循著作權(quán)相關(guān)義務(wù)。根據(jù)具體情形,這些義務(wù)可能包括:尊重權(quán)利人提出的TDM選擇退出聲明,或在必要情況下,通過達(dá)成直接授權(quán)協(xié)議獲得使用許可。收集到的數(shù)據(jù)需經(jīng)過清洗、標(biāo)注與處理,方可應(yīng)用于包括模型預(yù)訓(xùn)練、微調(diào)以及強(qiáng)化學(xué)習(xí)等在內(nèi)的多階段AI訓(xùn)練流程。盡管目前已有多個(gè)大型AI訓(xùn)練數(shù)據(jù)集可公開獲取,但這類數(shù)據(jù)集往往存在潛在的著作權(quán)風(fēng)險(xiǎn),可能包含盜版內(nèi)容、未經(jīng)授權(quán)使用的作品、授權(quán)錯(cuò)誤或未針對(duì)具體應(yīng)用場(chǎng)景定制的標(biāo)準(zhǔn)化許可內(nèi)容。這些問題可能引發(fā)著作權(quán)侵權(quán)責(zé)任在整個(gè)AI價(jià)值鏈中層層傳導(dǎo)——從數(shù)據(jù)集創(chuàng)建者、GenAI系統(tǒng)開發(fā)者到最終服務(wù)部署方,所有環(huán)節(jié)均需遵守歐盟著作權(quán)法規(guī)以及《人工智能法案》所設(shè)定的合規(guī)義務(wù)。
當(dāng)前,在線公開內(nèi)容已成為AI訓(xùn)練數(shù)據(jù)的重要來源。傳統(tǒng)用于搜索引擎索引的網(wǎng)絡(luò)爬取技術(shù),現(xiàn)已被廣泛用于大規(guī)模采集訓(xùn)練數(shù)據(jù)。這一變化促使越來越多的著作權(quán)所有者采取主動(dòng)措施限制其作品被用于AI訓(xùn)練。其中,機(jī)器人排除協(xié)議(REP)已成為事實(shí)上的網(wǎng)絡(luò)爬取管理標(biāo)準(zhǔn)工具,并被廣泛用作TDM權(quán)利保留的主要實(shí)施機(jī)制。然而,利益相關(guān)方普遍認(rèn)為,REP作為TDM選擇退出機(jī)制存在顯著局限性,更像是一種臨時(shí)性過渡方案。其主要缺陷包括:控制粒度有限、難以區(qū)分不同使用目的、依賴網(wǎng)站管理員主動(dòng)部署、缺乏法律強(qiáng)制力,以及依賴網(wǎng)絡(luò)爬蟲方自愿披露身份等。為彌補(bǔ)其不足,一些權(quán)利人還輔以流量管理等技術(shù)手段,以進(jìn)一步限制未經(jīng)授權(quán)的爬取行為。
鑒于AI生態(tài)系統(tǒng)的高度復(fù)雜性以及各內(nèi)容領(lǐng)域在商業(yè)模式和權(quán)利管理上的差異,目前尚未形成統(tǒng)一的、通用的權(quán)利保留標(biāo)準(zhǔn)。權(quán)利人通常采用法律驅(qū)動(dòng)措施與技術(shù)措施相結(jié)合的策略,以實(shí)現(xiàn)對(duì)文本與數(shù)據(jù)挖掘(TDM)使用的有效管理。法律措施包括單方權(quán)利聲明、許可協(xié)議限制、網(wǎng)站服務(wù)條款等;技術(shù)措施則除常用的機(jī)器人排除協(xié)議(REP)外,還涵蓋TDM保留協(xié)議、內(nèi)容真實(shí)性倡議(C2PA)、JPEG Trust標(biāo)準(zhǔn)等解決方案。
本研究從17項(xiàng)關(guān)鍵指標(biāo)出發(fā),對(duì)上述權(quán)利保留機(jī)制進(jìn)行了系統(tǒng)性評(píng)估,評(píng)估維度包括:對(duì)特定內(nèi)容類型的適配性(類型特異性)、對(duì)不同使用場(chǎng)景的區(qū)分能力(使用區(qū)分度)、以及在不同技術(shù)與法律環(huán)境下的適用靈活性(實(shí)施靈活性)等。
分析結(jié)果表明,當(dāng)前所有可用措施均不具備強(qiáng)制執(zhí)行能力,即權(quán)利保留聲明的效力尚依賴TDM用戶的自愿遵守與技術(shù)策略調(diào)整。為確保合規(guī),TDM使用者需主動(dòng)調(diào)整其數(shù)據(jù)收集與處理方式。在適用范圍上,法律措施通常可覆蓋特定作品或整個(gè)作品集;而技術(shù)措施則可分為兩類:“基于位置”的機(jī)制,依賴于內(nèi)容在網(wǎng)絡(luò)上的存儲(chǔ)位置(如URL);“基于資產(chǎn)”的機(jī)制,直接與內(nèi)容本身綁定,無論其傳播路徑如何變化,依然可追蹤識(shí)別。不同類型的措施各具優(yōu)勢(shì)與局限。來自行業(yè)利益相關(guān)方的訪談反饋顯示,多措組合已成為當(dāng)前權(quán)利保留實(shí)踐的行業(yè)常態(tài)。
研究表明,當(dāng)前技術(shù)解決方案正朝著開放標(biāo)準(zhǔn)與開源許可方向發(fā)展,以提升廣泛適用性和系統(tǒng)間的互操作性。無論是權(quán)利人還是AI開發(fā)者,普遍支持推進(jìn)權(quán)利保留機(jī)制的標(biāo)準(zhǔn)化進(jìn)程,同時(shí)強(qiáng)調(diào)需保留對(duì)不同使用場(chǎng)景的適應(yīng)靈活性。隨著GenAI生態(tài)的持續(xù)演化,預(yù)計(jì)將逐步形成適用于各內(nèi)容領(lǐng)域的定制化標(biāo)準(zhǔn)化實(shí)踐。
當(dāng)前形勢(shì)表明,國家知識(shí)產(chǎn)權(quán)局等公共機(jī)構(gòu)可在多個(gè)層面發(fā)揮關(guān)鍵作用:技術(shù)層面推動(dòng)建立面向權(quán)利人和AI開發(fā)者的TDM權(quán)利保留聯(lián)合數(shù)據(jù)庫;非技術(shù)層面包括加強(qiáng)公眾對(duì)AI與著作權(quán)問題的認(rèn)知宣傳,發(fā)布權(quán)利保留實(shí)施指南(如爬蟲識(shí)別標(biāo)記合集),并定期開展行業(yè)趨勢(shì)分析,關(guān)注技術(shù)發(fā)展動(dòng)態(tài)與商業(yè)授權(quán)條款的演變趨勢(shì)。
(3)生成式人工智能輸出環(huán)節(jié)
內(nèi)容生成的技術(shù)流程因生成式人工智能(GenAI)模型的類型而異,不同類型的內(nèi)容生成通常對(duì)應(yīng)不同的模型架構(gòu)。鑒于AI模型訓(xùn)練成本高昂,且頻繁更新訓(xùn)練數(shù)據(jù)面臨現(xiàn)實(shí)限制,業(yè)界正在加速采用檢索增強(qiáng)生成(RAG)技術(shù)。該技術(shù)通過將信息檢索機(jī)制與生成式AI能力相結(jié)合,在無需頻繁重訓(xùn)模型的前提下,顯著提升系統(tǒng)性能。
目前,RAG技術(shù)在AI驅(qū)動(dòng)的搜索引擎(亦稱“問答引擎”)中日益普及,為著作權(quán)人帶來了新的挑戰(zhàn)與機(jī)遇。RAG本身也引發(fā)了著作權(quán)爭(zhēng)議,其風(fēng)險(xiǎn)程度在很大程度上取決于具體應(yīng)用形式:若采用靜態(tài)RAG(基于本地存儲(chǔ)內(nèi)容進(jìn)行檢索),相對(duì)較易控管;而動(dòng)態(tài)RAG則可能涉及實(shí)時(shí)網(wǎng)絡(luò)爬取,從而帶來更復(fù)雜的著作權(quán)問題。
考慮到《人工智能法案》對(duì)GenAI系統(tǒng)輸出內(nèi)容的透明性提出了明確要求,近年來已開發(fā)出多種用于識(shí)別與披露合成內(nèi)容屬性的“生成透明度”技術(shù)措施,主要包括:1.內(nèi)容來源追蹤機(jī)制:如C2PA倡議、JPEG Trust倡議,以及基于區(qū)塊鏈的Trace4EU項(xiàng)目;2.AI生成內(nèi)容檢測(cè)工具:如圖像內(nèi)容的StyleGAN3-Detector,或Deezer開發(fā)的音頻識(shí)別方法;3.內(nèi)容處理技術(shù)方案:涵蓋多種數(shù)字水印與數(shù)字指紋協(xié)議;4.模型成員推斷攻擊(Membership Inference Attacks):用于檢測(cè)AI模型是否“記憶”了特定訓(xùn)練數(shù)據(jù),從而間接識(shí)別潛在的著作權(quán)風(fēng)險(xiǎn)。
本研究基于以下十項(xiàng)關(guān)鍵標(biāo)準(zhǔn),對(duì)部分現(xiàn)有的生成透明度措施進(jìn)行了系統(tǒng)性比較分析:(i) 類型分類、(ii) 多樣適用性、(iii) 開放性、(iv) 市場(chǎng)成熟度、(v) 可讀性、(vi) 成本考量、(vii) 穩(wěn)健性、(viii) 互操作性、(ix) 可擴(kuò)展性,以及 (x) 可靠性。該比較有助于深入理解不同措施的相對(duì)優(yōu)勢(shì)與局限。
在模型訓(xùn)練完成后,機(jī)器學(xué)習(xí)過程中提取的模式與關(guān)聯(lián)關(guān)系將被嵌入至模型參數(shù)中。這些參數(shù)對(duì)最終生成內(nèi)容的影響程度,取決于具體模型的架構(gòu)設(shè)計(jì)。部分生成式AI模型以高度抽象的方式編碼知識(shí),使其難以直接還原訓(xùn)練數(shù)據(jù);但另一些模型,特別是大型語言模型(LLMs)和生成式視覺模型,則可能存在“記憶化”(memorisation)現(xiàn)象。這種記憶化可能導(dǎo)致模型輸出內(nèi)容與訓(xùn)練輸入高度相似,甚至在某些情況下直接重復(fù)原始數(shù)據(jù)。由此帶來的問題不僅是技術(shù)性挑戰(zhàn),更可能引發(fā)法律風(fēng)險(xiǎn),如涉嫌抄襲或侵犯著作權(quán),特別是在模型“復(fù)述”受保護(hù)作品的場(chǎng)景下。
GenAI系統(tǒng)開發(fā)者已提出多項(xiàng)技術(shù)解決方案,以應(yīng)對(duì)“記憶化”(memorisation)問題。常見措施包括:用于比對(duì)生成內(nèi)容與潛在訓(xùn)練輸入的檢測(cè)工具、防止重復(fù)生成的輸出過濾機(jī)制,以及對(duì)提示詞(prompt)進(jìn)行重寫或過濾的策略。
一個(gè)新興的技術(shù)研究方向是“模型遺忘”(model unlearning)與“模型編輯”(model editing)。這些方法通過擦除、調(diào)整或更新嵌入模型參數(shù)的特定信息,使開發(fā)者能夠在模型部署后對(duì)已識(shí)別的問題進(jìn)行修復(fù)和調(diào)整。除上述技術(shù)路徑外,部分GenAI系統(tǒng)提供商還引入法律賠償機(jī)制,為其客戶提供一定程度的侵權(quán)風(fēng)險(xiǎn)緩釋,以應(yīng)對(duì)生成內(nèi)容可能侵犯第三方著作權(quán)的情況。
圍繞GenAI輸出與著作權(quán)相關(guān)的復(fù)雜議題,也進(jìn)一步凸顯了公共機(jī)構(gòu)在知識(shí)產(chǎn)權(quán)治理中的潛在作用:
1.面向GenAI開發(fā)者與政策制定者:公共機(jī)構(gòu)可公開共享有關(guān)降低侵權(quán)風(fēng)險(xiǎn)、識(shí)別合成內(nèi)容及推廣行業(yè)良好實(shí)踐的信息資源;
2.面向公眾:可提供關(guān)于“倫理提示詞”使用的指導(dǎo),與其他相關(guān)機(jī)構(gòu)協(xié)作,提高公眾識(shí)別AI生成內(nèi)容的能力和意識(shí);
3.在技術(shù)層面:公共機(jī)構(gòu)可作為信息共享與協(xié)作的平臺(tái),推動(dòng)不同平臺(tái)和GenAI系統(tǒng)之間輸出透明度機(jī)制的互操作性。
(3)結(jié)論性觀察
本研究通過技術(shù)路徑梳理,系統(tǒng)闡明了GenAI與著作權(quán)之間的互動(dòng)關(guān)系,并得出以下三項(xiàng)核心結(jié)論:
1.目前尚未出現(xiàn)單一、統(tǒng)一的標(biāo)準(zhǔn)機(jī)制,可供權(quán)利人用于行使其TDM權(quán)利保留聲明,或用于標(biāo)識(shí)與披露AI生成內(nèi)容的透明度措施;
2.盡管GenAI引發(fā)的法律爭(zhēng)議在全球范圍內(nèi)持續(xù)增加,研究也指出,權(quán)利人與GenAI開發(fā)者之間已達(dá)成多項(xiàng)高價(jià)值內(nèi)容授權(quán)協(xié)議;
3.當(dāng)前態(tài)勢(shì)表明,公共機(jī)構(gòu)可在以下方面發(fā)揮關(guān)鍵作用:一是為實(shí)施和管理TDM保留數(shù)據(jù)庫提供技術(shù)支持;二是加強(qiáng)對(duì)潛在侵權(quán)輸出的認(rèn)知與風(fēng)險(xiǎn)預(yù)防,并推動(dòng)行業(yè)良好實(shí)踐的傳播與應(yīng)用。
作為一項(xiàng)顛覆性技術(shù),GenAI的快速發(fā)展正深刻重塑創(chuàng)意產(chǎn)業(yè)與信息技術(shù)行業(yè),顯著改變了著作權(quán)所有者與AI開發(fā)者的互動(dòng)模式。盡管實(shí)現(xiàn)法律與商業(yè)秩序之間的新平衡仍需時(shí)間,研究特別強(qiáng)調(diào)了一點(diǎn):獲取作品來源與許可使用方式的關(guān)鍵信息,對(duì)于實(shí)現(xiàn)著作權(quán)的尊重、收益分配與有效執(zhí)法具有關(guān)鍵意義。
1
結(jié)論
本研究從歐盟著作權(quán)法的視角出發(fā),系統(tǒng)探討了生成式人工智能(GenAI)的發(fā)展動(dòng)態(tài),重點(diǎn)識(shí)別、分析并評(píng)估GenAI技術(shù)與著作權(quán)制度交匯處的關(guān)鍵趨勢(shì),特別關(guān)注AI生態(tài)系統(tǒng)中用于應(yīng)對(duì)著作權(quán)管理挑戰(zhàn)的各類技術(shù)措施。研究?jī)?nèi)容嵌入歐盟人工智能立法框架下,尤其聚焦與著作權(quán)相關(guān)的合規(guī)義務(wù)條款。本報(bào)告圍繞三大核心板塊展開分析:技術(shù)背景、GenAI輸入環(huán)節(jié)與GenAI輸出環(huán)節(jié)。
在技術(shù)背景部分,研究系統(tǒng)梳理了生成式人工智能技術(shù)的發(fā)展路徑,深入分析主要模型架構(gòu)的演進(jìn)與關(guān)鍵技術(shù)的部署實(shí)踐。這些技術(shù)進(jìn)展發(fā)生在特定的歐盟著作權(quán)法律環(huán)境之中,主要受《數(shù)字化單一市場(chǎng)版權(quán)指令》(CDSM指令,Directive (EU) 2019/790)與《歐盟人工智能法案》(AI法案,Regulation (EU) 2024/1689)規(guī)制。CDSM指令對(duì)著作權(quán)及數(shù)據(jù)庫權(quán)利人的專有復(fù)制權(quán)和提取權(quán)設(shè)定了若干例外情形,特別允許在無需權(quán)利人事先授權(quán)的情況下,出于特定目的開展文本與數(shù)據(jù)挖掘(TDM)活動(dòng),為AI模型訓(xùn)練提供了法律基礎(chǔ)。
對(duì)于商業(yè)性(非科學(xué)研究)文本與數(shù)據(jù)挖掘(TDM)活動(dòng),權(quán)利人可通過發(fā)布符合特定法律標(biāo)準(zhǔn)的權(quán)利保留聲明,將其作品排除在TDM例外適用范圍之外。這些法律標(biāo)準(zhǔn)的解釋與適用,將直接影響權(quán)利人行使控制權(quán)的策略選擇,并對(duì)GenAI開發(fā)者的數(shù)據(jù)獲取流程產(chǎn)生重要影響。根據(jù)《人工智能法案》,通用人工智能(GPAI)模型提供商必須制定并執(zhí)行符合歐盟著作權(quán)法的合規(guī)政策,其中包括識(shí)別并尊重TDM例外條款中權(quán)利人“選擇退出”聲明的義務(wù)。此外,GenAI系統(tǒng)提供商還需確保其生成內(nèi)容能夠以機(jī)器可讀形式加以標(biāo)注,并具備可檢測(cè)性,以增強(qiáng)輸出的透明度與可追責(zé)性。
目前,從著作權(quán)角度來看,GenAI的發(fā)展正日益受到多法域內(nèi)權(quán)利人與系統(tǒng)提供商之間司法訴訟的影響。截至目前,歐盟境內(nèi)已公開四起涉及AI訓(xùn)練與著作權(quán)的相關(guān)訴訟案件,其中三起在德國,一起在法國。2024年9月漢堡地方法院對(duì)“Kneschke訴LAION案”的判決,成為歐盟首例就AI訓(xùn)練與著作權(quán)爭(zhēng)議作出的民事判決。法院判定LAION(GenAI訓(xùn)練用圖文數(shù)據(jù)集主要提供商)可援引CDSM指令第3條所規(guī)定的科學(xué)研究目的TDM例外條款。盡管如此,判決中的若干附帶意見為未來法院在適用第4條——即商業(yè)性TDM活動(dòng)中的“選擇退出”機(jī)制法律標(biāo)準(zhǔn)時(shí),提供了潛在指引。
“Kneschke訴LAION案”同時(shí)引發(fā)了對(duì)所謂“數(shù)據(jù)洗白”現(xiàn)象的關(guān)注——即以“科學(xué)研究”這一較為寬泛的例外條款為依據(jù)開發(fā)訓(xùn)練數(shù)據(jù)集,盡管這些數(shù)據(jù)集最終可能被用于商業(yè)用途。近期直接授權(quán)市場(chǎng)出現(xiàn)重大進(jìn)展,權(quán)利人與GenAI開發(fā)商就受著作權(quán)保護(hù)作品的使用達(dá)成多項(xiàng)協(xié)議。盡管相關(guān)合同條款尚未公開,但市場(chǎng)趨勢(shì)分析表明,直接授權(quán)機(jī)制的興起受到多重因素推動(dòng),包括:對(duì)未來AI訓(xùn)練數(shù)據(jù)短缺的預(yù)期;權(quán)利人可提供的高質(zhì)量元數(shù)據(jù)與內(nèi)容標(biāo)注所帶來的附加價(jià)值;締約雙方之間的相對(duì)議價(jià)能力;專門服務(wù)于中小權(quán)利人的內(nèi)容聚合與中介平臺(tái)的快速發(fā)展。隨著市場(chǎng)進(jìn)一步成熟,有望逐步形成涵蓋定價(jià)標(biāo)準(zhǔn)、合同條款結(jié)構(gòu)及報(bào)酬基準(zhǔn)機(jī)制的行業(yè)規(guī)范。 在這一新興生態(tài)中,數(shù)據(jù)策展方、數(shù)據(jù)集提供商與內(nèi)容分發(fā)平臺(tái)正日益成為連接權(quán)利人和AI開發(fā)者之間的關(guān)鍵中介力量。但其核心挑戰(zhàn)在于:如何提升許可條款的清晰性、合法性與適用性,確保內(nèi)容使用符合各方預(yù)期與合規(guī)要求。此外,檢索增強(qiáng)生成(RAG)技術(shù)在提升GenAI系統(tǒng)實(shí)時(shí)信息處理能力的同時(shí),也帶來了新的著作權(quán)挑戰(zhàn)。盡管如此,RAG技術(shù)為新聞、科學(xué)和學(xué)術(shù)出版等領(lǐng)域的權(quán)利人提供了獨(dú)特的內(nèi)容授權(quán)與商業(yè)合作機(jī)會(huì)
“網(wǎng)絡(luò)爬取”已成為當(dāng)前主流的AI訓(xùn)練數(shù)據(jù)收集方式,并催生了一系列針對(duì)公開網(wǎng)絡(luò)內(nèi)容的自動(dòng)化挖掘工具。在此背景下,機(jī)器人排除協(xié)議(REP)雖被廣泛視為管理網(wǎng)絡(luò)爬取行為的事實(shí)行業(yè)標(biāo)準(zhǔn),但作為權(quán)利保留機(jī)制,其存在一系列固有局限:缺乏對(duì)使用場(chǎng)景和許可目的的精細(xì)區(qū)分,無法實(shí)現(xiàn)差異化控制;依賴網(wǎng)站管理員主動(dòng)配置,易導(dǎo)致部署不一致、執(zhí)行效果參差;不具法律強(qiáng)制力,完全依賴爬取方的自愿遵守;要求爬蟲操作方公開披露身份和用途信息,這對(duì)使用多種爬蟲工具的機(jī)構(gòu)構(gòu)成操作上的負(fù)擔(dān)。
在當(dāng)前法律與技術(shù)環(huán)境下,尚未形成統(tǒng)一適用的權(quán)利保留標(biāo)準(zhǔn)機(jī)制。實(shí)踐中,權(quán)利人通常采用法律驅(qū)動(dòng)手段(如單方聲明、許可限制、網(wǎng)站服務(wù)條款)與技術(shù)措施相結(jié)合的方式,以表達(dá)其TDM權(quán)利保留意圖。在技術(shù)路徑上,現(xiàn)有措施大致可分為兩類:“基于位置”的措施:綁定于特定存儲(chǔ)路徑或網(wǎng)站上的內(nèi)容副本,僅對(duì)特定分發(fā)位置生效;“基于資產(chǎn)”的措施:直接嵌入內(nèi)容本身,無論其傳播路徑如何變化,均可隨附執(zhí)行。本研究通過17項(xiàng)關(guān)鍵指標(biāo)對(duì)比了各類保留措施的優(yōu)劣。
盡管不同模型架構(gòu)在訓(xùn)練與內(nèi)容生成流程上存在差異,但著作權(quán)人普遍擔(dān)憂,部分模型可能存在“記憶”訓(xùn)練數(shù)據(jù)的風(fēng)險(xiǎn),從而生成涉嫌侵權(quán)的內(nèi)容。為降低此類風(fēng)險(xiǎn),一些模型提供商已部署多項(xiàng)防侵權(quán)技術(shù)措施,包括:輸入輸出內(nèi)容自動(dòng)比對(duì)、提示詞事前過濾、生成內(nèi)容事后篩查,以及為用戶提供一定程度的法律免責(zé)保障。與此同時(shí),諸如“模型遺忘”與“模型編輯”等新興技術(shù)尚處研發(fā)驗(yàn)證階段,其在大規(guī)模商業(yè)環(huán)境下的應(yīng)用可行性仍有待進(jìn)一步評(píng)估。
為響應(yīng)《人工智能法案》關(guān)于生成內(nèi)容“可檢測(cè)性”的合規(guī)要求,模型提供商正采用來源追蹤、生成內(nèi)容檢測(cè)、數(shù)字水印、指紋識(shí)別及成員推理攻擊等多種技術(shù)方案。本研究基于10項(xiàng)關(guān)鍵指標(biāo),對(duì)各類輸出透明度技術(shù)方案進(jìn)行了系統(tǒng)比較,指出各項(xiàng)技術(shù)在當(dāng)前均存在優(yōu)勢(shì)與局限。
鑒于AI生態(tài)的復(fù)雜性,知識(shí)產(chǎn)權(quán)局等公共機(jī)構(gòu)可提供技術(shù)或非技術(shù)支撐:非技術(shù)層面包括公眾意識(shí)培育、GenAI市場(chǎng)技術(shù)商業(yè)動(dòng)態(tài)追蹤、利益相關(guān)方對(duì)話協(xié)調(diào)機(jī)制建設(shè),以及著作權(quán)管理措施的文檔化工作;技術(shù)層面則可著力彌補(bǔ)現(xiàn)有技術(shù)方案缺陷,推動(dòng)解決方案創(chuàng)新。
中企檢測(cè)認(rèn)證網(wǎng)提供iso體系認(rèn)證機(jī)構(gòu)查詢,檢驗(yàn)檢測(cè)、認(rèn)證認(rèn)可、資質(zhì)資格、計(jì)量校準(zhǔn)、知識(shí)產(chǎn)權(quán)貫標(biāo)一站式行業(yè)企業(yè)服務(wù)平臺(tái)。中企檢測(cè)認(rèn)證網(wǎng)為檢測(cè)行業(yè)相關(guān)檢驗(yàn)、檢測(cè)、認(rèn)證、計(jì)量、校準(zhǔn)機(jī)構(gòu),儀器設(shè)備、耗材、配件、試劑、標(biāo)準(zhǔn)品供應(yīng)商,法規(guī)咨詢、標(biāo)準(zhǔn)服務(wù)、實(shí)驗(yàn)室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術(shù)交流、新品推薦等全方位推廣服務(wù)。這個(gè)問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測(cè)認(rèn)證網(wǎng)在線客服13550333441。為您提供全面檢測(cè)、認(rèn)證、商標(biāo)、專利、知識(shí)產(chǎn)權(quán)、版權(quán)法律法規(guī)知識(shí)資訊,包括商標(biāo)注冊(cè)、食品檢測(cè)、第三方檢測(cè)機(jī)構(gòu)、網(wǎng)絡(luò)信息技術(shù)檢測(cè)、環(huán)境檢測(cè)、管理體系認(rèn)證、服務(wù)體系認(rèn)證、產(chǎn)品認(rèn)證、版權(quán)登記、專利申請(qǐng)、知識(shí)產(chǎn)權(quán)、檢測(cè)法、認(rèn)證標(biāo)準(zhǔn)等信息,中企檢測(cè)認(rèn)證網(wǎng)為檢測(cè)認(rèn)證商標(biāo)專利從業(yè)者提供多種檢測(cè)、認(rèn)證、知識(shí)產(chǎn)權(quán)、版權(quán)、商標(biāo)、專利的轉(zhuǎn)讓代理查詢法律法規(guī),咨詢輔導(dǎo)等知識(shí)。
本文內(nèi)容整合網(wǎng)站:中國政府網(wǎng)、百度百科、搜狗百科、360百科、知乎、市場(chǎng)監(jiān)督總局 、國家知識(shí)產(chǎn)權(quán)局
免責(zé)聲明:本文部分內(nèi)容根據(jù)網(wǎng)絡(luò)信息整理,文章版權(quán)歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)跟我們聯(lián)系刪除并致歉!










