#本文僅代表作者觀點,不代表IPRdaily立場,未經(jīng)作者許可,禁止轉(zhuǎn)載#
“本文以一案例的被告為研究視角,以其身份定位為始、民事責任為尾對整個審判思路進行初步剖析?!?br/>
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:楊思雪 北京金山云網(wǎng)絡技術有限公司
楊淼 北京金山云網(wǎng)絡技術有限公司
全球首例生成式AI服務提供者侵犯著作權案(2024年粵0192民初113號)生效已兩月有余,學界對此問題的探討一直在持續(xù)。在AIGC技術革新的背景下,傳統(tǒng)著作權觀念受到前所未有的挑戰(zhàn),著作權所有者與AIGC之間的治理爭議日益加劇,該案為判斷AIGC服務提供者是否構成著作權侵權提供了重要的司法指引。盡管如此,隨著技術的不斷革新,AIGC服務的應用形態(tài)和場景將變得更加多元和復雜。在保護著作權所有者的權益與促進技術創(chuàng)新之間尋找平衡,將是一個長期且復雜的議題。
本文以該案的被告為研究視角,以其身份定位為始、民事責任為尾對整個審判思路進行初步剖析,斗膽嘗試總結AIGC服務提供者在法律層面上的困境,以期為司法界及產(chǎn)業(yè)提供參考,如有不當之處,請諒解。
一、身份定位不清——非模型訓練方的AIGC服務提供者
本案中,法院以被告通過可編程接口的方式接入第三方服務商的系統(tǒng),進而向用戶提供生成式人工智能服務,符合《生成式人工智能服務管理暫行辦法》(以下簡稱“《辦法》”)第二十二條第二款:“(二)生成式人工智能服務提供者,是指利用生成式人工智能技術提供生成式人工智能服務(包括通過提供可編程接口等方式提供生成式人工智能服務)的組織、個人”的描述,進而將本案被告的身份界定為“生成式人工智能服務提供者”。但從本案侵權行為所涉及的整個AIGC工作流程來看,“生成式人工智能服務提供者”實際上是一個較為模糊的界定。
AIGC生成具體內(nèi)容的整個過程涉及多方主體,按照技術結構大概可以分為模型訓練方(如OpenAI)、面向B端的模型二次開發(fā)方(ChatGPT開放B端接口,為相關公司在其業(yè)務經(jīng)營中使用AIGC提供技術支持,ChatGPT即為模型二次開發(fā)方)、面向C端的應用方(如Stable Diffusion等提供的文生圖服務)、用戶。其中,一定程度上,模型的二次開發(fā)方和應用方均為AIGC服務提供者。本案的被告“并沒有使用案涉奧特曼形象進行訓練”“關于原告將案涉奧特曼物料從其訓練集中刪除的訴請,因被告未實際進行模型訓練行為,本院對該項訴請不予支持”并且“被告經(jīng)營的Tab網(wǎng)站可生成與案涉奧特曼形象相同或相似的圖片”,故而可以得出:本案的被告系面向C端的應用方,其以接口調(diào)用的方式將模型訓練方/模型二次開發(fā)方所提供的AIGC技術切實融入用戶需求,實現(xiàn)具有AI對話及AI生成繪畫功能的Tab網(wǎng)站落地,其自身并未參與預訓練環(huán)節(jié),更像是AIGC技術與用戶之間的“中間商”,更為合適的身份界定應當為“非模型訓練方的AIGC服務提供者”。
法院基于《辦法》將被告認定為生成式人工智能服務提供者符合立法之規(guī)定,《辦法》特意以括號的形式強調(diào)了以“可編程接口等方式提供生成式人工智能服務”屬于生成式人工智能服務者。但筆者認為,從技術角度來講,進行模型訓練與否在效果上存在明顯差異,主客觀狀態(tài)也并不等同,在進行法律評價時更不應一概而論,法律的評價應當以違法行為為評價的基礎,而非囿于立法之模糊定位。當然,以上所述的流程中,被告或許真的參與了模型訓練,筆者不得而知,本文僅基于判決書所提供的內(nèi)容和邏輯展開分析。
二、侵權行為判定之謎——從判定標準到重復評價
1、無抗辯之力的判定標準——接觸+實質(zhì)性相似
本案中,法院以“接觸+實質(zhì)性相似”規(guī)則為判定標準,以傳統(tǒng)的著作權侵權判定思路和標準來講,本案被告方存在接觸的可能性,案涉圖片也確實構成實質(zhì)性相似,認定侵權并無不妥。但,法院在判決書中指出“關于原告將案涉奧特曼物料從其訓練數(shù)據(jù)集中刪除的訴請,因被告并未實際進行模型訓練行為,本院對該項訴請不予支持?!币簿褪钦f,法院認為的被告侵權的具體流程應該為:被告接觸了案涉奧特曼形象——但沒有用奧特曼形象訓練既得模型——用戶使用——產(chǎn)生了最終的侵權作品。
“接觸+實質(zhì)性相似”規(guī)則屬于法院判斷侵權的、約定俗成的司法規(guī)則,該規(guī)則的具體內(nèi)容是指,如果在后創(chuàng)作的作品與在先作品構成實質(zhì)性相似,且在后創(chuàng)作作品的作者具有接觸在先作品的可能性,則推定排除在后作品為其作者獨立創(chuàng)作而成,在后作品作者的行為構成剽竊行為。接觸可能性在當前的技術背景下,原告方只需要如本案原告一般舉證證明其在先發(fā)表、網(wǎng)絡發(fā)布、知名度等,即可推定被告方存在接觸可能性。相較于原告舉證的輕易性,被告想要舉證以推翻“接觸”認定的可能性則約等于零,而在本案AIGC的技術背景下,被告的舉證責任變得更加艱巨。AIGC的輸出取決于它的輸入,如果明確被告沒有將涉案圖片用于訓練模型的輸入,即可說明最終輸出的侵權結果與被告的接觸與否并無因果關系。但因為接觸可能性的存在,哪怕被告舉證證明自己并未實際使用案涉奧特曼形象訓練模型,被告依然會被認定符合判定侵權的標準,也即,原告的先發(fā)表行為等于將被告釘在了“侵權柱”上,被告基本不可能抗辯成功。
筆者認為,AIGC背景下,“接觸+實質(zhì)性相似”的判定標準應當隨技術發(fā)展有所調(diào)適,在著作權侵權案件中可責難一定是行為而非“機會”。首先,從調(diào)適可能性來講,該判定標準并非采法定主義由立法直接規(guī)定,而是緣起于我國對美國相關判例規(guī)則[1]的借鑒,隨著我國技術與侵權手段等實際情況的變化,司法規(guī)則有適應性調(diào)整的可行性和需求性。其次,從調(diào)試的必要性來看,AIGC背景下的“接觸+實質(zhì)性相似”規(guī)則適用可能是割裂的,從本案邏輯來看,“接觸”并決定輸入的另有其人,只是被告所經(jīng)營的輸出端產(chǎn)生了“實質(zhì)性相似”的侵權作品罷了,侵權主體與侵權結果之間的因果關系是侵權事實認定必不可少的一環(huán),如果再生硬地照搬該判定規(guī)則對被告進行判定,仿佛不具有說服力,約等于是架空了“接觸”這個構成要件的目的和意義。
2、不甚明晰的認定結果——同一行為和重復評價
本案中,法院認定被告侵犯了原告的復制權和改編權,對于原告所主張的信息網(wǎng)絡傳播權,法院的態(tài)度是:“考慮到本案是生成式人工智能發(fā)展背景下生成物侵權的新情況,且本院已支持了其復制權、改編權侵權的主張,在同一被訴侵權行為已經(jīng)納入復制權、改編權控制范疇的情況下,本院不再進行重復評價”,對其持重復評價和回避評價的態(tài)度,在特殊的技術背景下,法院采用審慎的態(tài)度也并無不妥。但以AIGC發(fā)展勢頭之猛,對生成式人工智能生成的侵權事實進行評價已是箭在弦上,類案終究需要予以解決,理清該問題具有一定的必要性。
首先,針對復制權和改編權的“同一行為”到底是什么呢?如上所述,本案被告所涉及到的行為僅是內(nèi)容輸出行為,將帶有版權內(nèi)容的結果提供給了用戶,被告并不參與模型訓練。那在內(nèi)容輸出這一行為中,到底可能侵犯哪些權利呢?法院認定被告侵犯原告復制權和改編權,在本案文生土圖的內(nèi)容輸出過程中,用戶輸入Prompt引導已訓練好的模型產(chǎn)生期望的輸出結果,案述侵權結果才能夠躍然于畫布之上。這一過程中,被告做了什么呢?將所獲得的模型提供給用戶、呈現(xiàn)最終結果,但這兩個流程好像都和復制沾不上邊。數(shù)字環(huán)境下的復制行為是指能夠使得作品以數(shù)字化的形式高質(zhì)量地被固定在新型物質(zhì)載體之上,在本案中在被告沒有實際接觸案述奧特曼形象的情況下,因模型訓練方的訓練是自然語言向詞向量即數(shù)字的轉(zhuǎn)換,牽強來講只能認為被告復制了模型訓練方訓練好的參數(shù),但對非原圖的復制好像也不能稱之為復制。但如果認為該參數(shù)保留了原作品基本的表達,加上用戶的Prompt,又生成了保留原作品基本表達的作品,被認為是著作權法上的改編行為好像也無可厚非。
其次,針對“重復評價”來講,究竟重復在哪里呢?筆者很疑惑,以上兩項權利與信息網(wǎng)絡傳播權并不重合。復制權和信息網(wǎng)絡傳播權,前者控制的是單純的復制行為,而后者控制的是由上傳等導致的作品處于可為公眾在其選定的時間和地點獲得的狀態(tài)[2],這與改編權的改變以形成新作品也并不相同。信息網(wǎng)絡傳播行為交互式網(wǎng)絡傳播行為,能夠使用戶“按需”獲得作品,但在AIGC的背景下,模型輸出結果的不可控性,我們無法得知用戶能夠在何時能夠獲取到作品,或許經(jīng)過用戶多次調(diào)試后,真的能夠得到作品,但也無法保障是在用戶“選定的時間”獲得作品,從技術層面看,似乎本案又并不構成對信息網(wǎng)絡傳播權的侵犯,故而談不上重復評價的問題。
三、AIGC服務提供者損害后果之補救——民事責任部分
1、停止侵害真的能停?
法院認為,被告未實際進行模型訓練,所以不支持原告將奧特曼物料從其訓練數(shù)據(jù)集中刪除的訴請,而是要求被告進一步采取關鍵詞過濾等措施,防范再生成與案涉奧特曼作品實質(zhì)性相似的圖片。原告之所以要求刪除數(shù)據(jù)集,也是知曉AIGC的輸出由其輸入決定,訴其內(nèi)容輸出侵權只是手段,想要禁止AI對其作品內(nèi)容進行訓練才是原告的維權目的。
但已訓練好的模型,不僅完全刪除存在困難,哪怕是刪除數(shù)據(jù)集也很難避免模型再生成侵權作品。AI大模型本質(zhì)上是通過不斷地調(diào)整模型參數(shù)來盡可能縮小模型預測結果和實際目標之間的差距,通過大量數(shù)據(jù)對大模型進行訓練,其復雜性和非線性特征使得在完成訓練的模型中定位和刪除特定數(shù)據(jù)的難度明顯增大[3],即便是大模型的創(chuàng)造者——模型所有者、開發(fā)者與服務提供者都無法確切得知需要刪除的數(shù)據(jù)在哪里[4],待刪除數(shù)據(jù)處于信息不可知的狀態(tài),想要刪除數(shù)據(jù)存在困難。其次,大模型具有推理能力已然被證實,也是當前AI技術應用的焦點之一,其推理能力可能會使得已刪除的數(shù)據(jù)又被重新推理還原,刪除原始數(shù)據(jù)并不能解決輸出端的版權侵權問題。當前已知的確保能夠根本上解決刪除問題的手段唯有重新訓練模型,但其成本高昂,也很難保證模型不會根據(jù)其他數(shù)據(jù)推理出奧特曼形象。
好在技術的發(fā)展從不會讓人悲觀,機器遺忘(Machine Unlearning,MU)技術應運而生,旨在從預訓練模型中移除不良數(shù)據(jù)的影響及其相關模型能力,同時保持對其他信息的完整知識生成,而不影響因果無關的信息。[5]如果該技術真的能夠達到預期效果,原告及之后著作權人的訴請都由“刪除”變“遺忘”,討論合理使用制度好像也沒有必要操之過急,不如讓“技術的子彈再飛一會兒”。
2、賠償損失真有過錯?
知識產(chǎn)權侵權行為在理論上被分為直接侵權和間接侵權,直接侵權行為不以主觀過錯為構成要件,但系承擔賠償責任的前提,主觀過錯乃間接侵權行為的構成要件之一。[6]依照本案法院的觀點,被告的行為屬于直接侵權行為,在對賠償責任的論述中,法院以《辦法》第四條之生成式人工智能服務提供者應當“尊重知識產(chǎn)權”而判定被告應當具有合理的注意義務,并以投訴機制、潛在風險提示機制、顯著標識等欠缺論證了被告未盡到合理的注意義務,具有主觀過錯,需要承擔賠償責任。
筆者認為,《辦法》屬于部門規(guī)章,屬于公法,在法律責任部分,《辦法》第十八條規(guī)定:“使用者發(fā)現(xiàn)生成式人工智能服務不符合法律、行政法規(guī)和本辦法規(guī)定的,有權向有關主管部門投訴、舉報”而非向人民法院起訴,在最終的法條依據(jù)部分,并未提及《辦法》,足可見法院并不能直接適用《辦法》來認定被告賠償責任的承擔。而法院所提到的被告未盡到合理注意義務的情形,由《辦法》所述可由有關主管部門予以處罰,在無特別規(guī)定的情況下,再將其于私法中予以評價則屬于對同一違法行為的重復評價,因此,不能以《辦法》之規(guī)定認定被告未盡到合理注意義務而存在過錯。
總的來講,筆者認為,AIGC的輸出不可控,其運作過程更是涉及多方主體,因果關系多元化,最終侵權結果的產(chǎn)生并非如本案被告的服務提供商一方導致,故而在對AIGC侵權案件進行歸責時,應當以AIGC的運作流程及各方具體的侵權行為為基礎進行評價?,F(xiàn)行著作權評價思維雖可在短期內(nèi)對AIGC著作權案件進行歸責,但仔細推敲歸責邏輯,仍有不盡完美之處。法院判決書中強調(diào)“考慮到生成式人工智能產(chǎn)業(yè)正處于發(fā)展的初期,需要同時兼顧權利保障和產(chǎn)業(yè)發(fā)展,不宜過度加重服務提供者的義務”,但不甚清晰的法律定位、異常艱巨的舉證責任不禁讓筆者產(chǎn)生疑問,只是調(diào)用模型的平臺服務提供者的義務真的沒有被加重嗎?新的技術背景下,要求如本案被告一般的平臺服務提供者對用戶使用第三方訓練的模型生成的內(nèi)容進行全面審查并承擔侵權責任何嘗不是一種苛責?綜上,筆者認為,免除抑或是減輕“善意”平臺服務提供者的責任是協(xié)調(diào)AIGC產(chǎn)業(yè)發(fā)展和知識產(chǎn)權權益保護關系的有效路徑,具體內(nèi)容上或可以借鑒“避風港原則”來緩解AIGC平臺服務提供者畸重的法律責任,以盡快建立新的技術背景下的平臺責任規(guī)則,促成AIGC背景下的著作權法思維完善體系,助力AI技術的良性成長與行業(yè)的長期發(fā)展。
注釋:
[1]美國法院在1869年的Laurence v. Dana案(15F. Cas. 26, 1869S)中提出。
[2]王遷. 復制權與信息網(wǎng)絡傳播權的關系[J]. 湖南師范大學社會科學學報,2022,51(02):1-9.
[3]LIANG W, TADESSE G A, HO D, et al. Advances, challenges and opportunities in creating data for trustworthy AI[J]. Nature Machine Intelligence, 2022, 4(8): 669-677.
[4]丁曉東.人機交互決策下的智慧司法[J].法律科學(西北政法大學學報),2023,41(4):58-68.
[5]https://mp.weixin.qq.com/s/XGK5jHKD-Iqk_6Z5KxDMoA
[6]王遷,知識產(chǎn)權法教程[M],第七版,北京中國人民大學出版社,2021:14-22.
楊思雪作者專欄
時代背景難忽:AI文生圖第一案簡析
楊淼作者專欄
3、從企業(yè)知識產(chǎn)權從業(yè)者的角度看——知識產(chǎn)權的價值與意義
5、“三位一體”知識產(chǎn)權綜合管理體系建立的趨勢與實操分析
9、「蘋果+谷歌+FaceBook」三大平臺的知識產(chǎn)權攻防術!
10、從“川普”商標事件看企業(yè)知識產(chǎn)權工作的實操特殊性
11、誰這么厲害?竟然提前注冊蘇寧和阿里共同出資的“貓寧電商”商標
(原標題:淺議AIGC服務提供者的法律困境——以“奧特曼案”的被告為視角)
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:楊思雪 北京金山云網(wǎng)絡技術有限公司
楊淼 北京金山云網(wǎng)絡技術有限公司
編輯:IPRdaily辛夷 校對:IPRdaily縱橫君
注:原文鏈接:淺議AIGC服務提供者的法律困境——以“奧特曼案”的被告為視角(點擊標題查看原文)
「關于IPRdaily」
IPRdaily是全球領先的知識產(chǎn)權綜合信息服務提供商,致力于連接全球知識產(chǎn)權與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權負責人,還有來自政府、律師及代理事務所、研發(fā)或服務機構的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://m.globalwellnesspartner.com
文章不錯,犒勞下辛苦的作者吧