
高成
北京韬安律师事务所律师、
国际保护知识产权协会(AIPPI)中国分会版权专业委员会、
信息技术和互联网专业委员会委员
一、版权议题背景
从《纽约时报》诉OpenAI,到全球不断涌现的作者/版权方向AI巨头发起的维权诉讼,人工智能技术引发的版权争议已成为全球知识产权界面临的最紧迫挑战。各国立法与司法步调不一,亟需一个协调、平衡的国际规则框架。
在此背景下,AIPPI(国际保护知识产权协会)2025年横滨世界知识产权大会将“AI与著作权”列为核心议题,经各国多轮调研、辩论、表决,形成最终决议(下称《决议》)。这是AIPPI继2019年伦敦大会“AI生成作品”议题后,对人工智能版权问题的又一次重要关切和回应。
本届议题回应了当下AI与版权领域最核心的三大问题:一是未经授权使用受版权保护作品进行模型训练(输入端)的合法性问题;二是人工智能生成内容(输出端)的侵权认定问题;三是侵权主体认定和责任承担问题。本次大会《决议》的通过,标志着国际知识产权界在这一前沿问题的博弈中艰难地寻求全球共识,并试图在激励技术创新与保护创作者权益之间,划定一条关键的平衡线。
二、《决议》核心条款解读
本届大会版权议题直面了AI大模型开发使用过程中的数据训练、内容输出和责任承担三大核心争议,分析如下:
1. 数据训练(输入端)
AI使用作品进行数据训练是否需要授权,可以说是目前国际上AI版权争议最大的问题。各国就此问题的立法、司法实践,也存在较大差异。作为议题背景简要介绍如下。
欧盟在2019年通过的《数字化单一市场版权指令》(DSM指令)规定了文本与数据挖掘例外(TDM例外),即任何主体以文本和数据挖掘为目的(无论是否为商业目的)复制、摘录合法获取的作品和其他内容,都不构成著作权侵权,除非著作权人以机器可读等适当方式明确保留其权利。欧盟2024年通过的《人工智能法案》(EU AI Act)也延续了该规定要求。日本在2018年修订的《著作权法》中加入了“非享受性使用”的合理使用条款,即只要不以“享受作品表达的思想或情感”为目的,同时符合“必要限度”与“不损害著作权人利益”,即可以使用该作品。中国和美国在立法中尚未就人工智能设置专门的例外情形,但在司法实践中,都已有案例认定数据训练符合一定条件即可以构成合理使用。如“杭州奥特曼”案1中,杭州互联网法院认为:“在无证据证明生成式人工智能是为使用权利作品的独创性表达为目的、已影响到权利作品正常使用或者不合理地损害相关著作权人的合法利益等情形下,可以被认为是合理使用。”美国加利福尼亚北区联邦地区法院在Anthropic案2和Meta案3中,根据合理使用四要素分析,均认定单纯的数据训练具有高度转换性,构成合理使用。
以上可见,就数据训练,日本采取了更加鼓励人工智能新兴产业发展的立法政策(原则上无需授权),欧盟则采取了相对倾向于权利人保护的方案(权利人可选择退出),而中国和美国都保留较大的解释弹性,更多交给了司法实践去个案认定。
经过多轮调研和讨论,面对AI数据训练是否需要获得授权的问题,《决议》明确使用受版权保护的作品训练AI系统,应获得权利人的授权,但同时也明确了,对于符合著作权保护的例外(如合理使用)的情形,无需取得授权(第2条)。这一规定将AI训练行为置于既有版权法律框架的管辖之下,为全球创作者奠定了权利主张的基石。但针对著作权保护的例外,《决议》也为创新保留了空间,承认各国既有的版权保护例外/合理使用规则在符合条件时仍可适用(需符合《伯尔尼公约》的三步检验法),并特别鼓励为非营利、符合公共利益的目的(如非商业的科学研究或教育)设立专门的AI训练例外(第4条)。
针对商业目的的数据训练,《决议》规定:如果一国立法允许商业目的的训练,那么必须同时赋予权利人两项权利:一是“选择退出”权(Opt-out): 权利人有权通过明示方式拒绝其作品被用于AI训练;二是“经济补偿”权: 对未行使退出权的权利人进行相应的经济补偿(第5条)。
当然,上述“选择退出”和“经济补偿”都依赖一个共同的前提:权利人必须知道自己的作品被使用了。就此,《决议》规定,AI系统提供者必须提供“充分的信息”以说明训练中使用的数据,并前瞻性地要求识别“由用户输入并被AI系统用于(再)训练”的内容(第7条)。该“透明度义务”,是支撑版权保护体系的重要支点。至于透明度相关的具体要求,仍留待各国在实践中继续探索和细化。
可以看出,《决议》关于数据训练的约束机制借鉴了欧盟《DSM指令》中的TDM例外原则。它没有一刀切地禁止商业目的的数据训练,但为其设置了“门票”——要么尊重权利人的“退出”意愿,要么支付合理的“补偿”。这一机制体现了各国在激烈的观点博弈下,为技术创新和版权保护之间进行平衡的努力。
2.内容输出(输出端)
关于输出内容是否侵权,《决议》明确应适用各国既有的侵权认定规则(如“接触”+“实质性相似”) 进行判断(第8条)。这也符合司法实践中法院通常采用的传统的侵权认定标准。另外,基于“思想/表达”二分法,《决议》也认定不应仅因“风格”的相似而构成著作权侵权(第10条)。
值得注意的是,在最近发布的欧洲首个生成式AI判决4(GEMA诉OpenAI)中,因OpenAI的大模型可以在用户的简单提示词下再现受保护的歌词,德国慕尼黑第一地区法院认为符合德国著作权法第16条“有形固定+可感知”要求,认定被告侵犯了复制权,且不属于TDM例外(法院认为仅覆盖临时复制)。由此可见,输出内容是否包含或再现权利人的作品内容或元素,是法院认定是否构成侵权的关键环节。在中国“杭州奥特曼”案等案例中,法院最终认定侵权的核心也在于输出内容的侵权。
此外,《决议》也确立了输出端与输入端相对独立的原则,即不应仅因数据训练侵权,而直接推定输出内容也构成侵权(第11条)。当然,数据训练取得了授权或属于合理使用,也不能当然得出输出的内容不构成侵权(第12条)。也就是说,输出内容是否构成侵权,需要独立判断。
3. 侵权主体认定和责任承担
《决议》明确,人工智能系统/模型本身,在满足a) 人工智能系统的训练使用了超过最低限度数量、非法使用的受著作权保护的内容;或 b) 该人工智能系统被专门开发用以生成侵权内容的条件下,应当认定为侵权物品(第13条)。该规定与我国司法实践情况也相符合,如在前述“杭州奥特曼”案中,法院认为,被诉侵权LoRA模型本身系由用户下载的奥特曼图片进行投喂训练而成,其中难免包含能够体现奥特曼形象独创性的设计特征,且被诉侵权LoRA模型发布后可以由用户便捷、随意地使用,进而不断扩大侵权影响,故判决被告删除该奥特曼LoRA模型。
关于侵权责任的承担主体,《决议》明确,AI系统提供者、商业利用者和用户,都可能构成侵权责任的承担主体(第14条)。
该规则也与中国司法实践情况相呼应。关于用户责任,在上海金山法院近期审理的“美杜莎”案5中,被诉用户使用平台的“训练LoRA”功能,将美杜莎图包作为训练素材投入生成两款LoRA模型,其他用户通过使用该模型并输入不同提示词,能够生成与美杜莎形象相同或实质性相似的各种图片。法院认为,被诉用户以商业使用为目的,在素材截取阶段及LoRA模型训练、发布及使用阶段再现在先作品的独创性表达、将“美杜莎”图集和短视频等素材通过网络提供给公众,侵害了原告对“美杜莎”作品享有的复制权和信息网络传播权。
关于平台责任,如果AI平台未参与具体LoRA定制模型的训练和发布,提供的是中立的技术,属于网络服务提供者,则可以视情形适用避风港规则。在“杭州奥特曼”案中,因被诉平台在用户协议中声明不对用户上传和发布的内容进行审核,且未在网站相对明显的位置设置投诉举报渠道,法院认定其未采取合理必要措施,构成帮助侵权。但在“美杜莎”案中,因被诉平台向用户尽到了合理告知义务,设置了投诉举报机制和发布审核机制,在收到起诉状后及时下架了全部侵权模型,更新平台审核机制中的筛选关键词,还及时通知了海外AI平台,主观上并无过错,客观上尽到了“采取必要措施”“转通知”义务,故不构成侵权。
最后,《决议》还明确了侵权责任的承担方式,无论是训练端、输出端、还是人工智能系统本身构成侵权,权利人都有权视情形获得损害赔偿、禁令、召回或销毁等救济。损害赔偿还应当考虑侵权方的利润,但所有制裁和救济均应基于个案适用并考虑比例原则。
三、决议启示
2025AIPPI横滨版权《决议》在AI数据训练、输出、侵权认定等核心问题上达成了较大范围的全球共识,对人工智能时代下的技术创新和版权保护的平衡进行了积极探索,并将为未来与AI相关的国际条约、规则及各国专门法律提供坚实的立法参考。
AI发展和版权制度的“博弈”不仅复杂,而且也必然是一个长期的过程。在技术不断向前飞奔的路上,版权《决议》的相关条款内容充分体现了尊重创作、权利保护的人文精神和关怀。在未来技术和组织条件成熟的情况下,提高和细化AI开发者的透明度义务,通过法定许可等方式,向集体管理组织或其他有代表性的组织进行集体付酬和分配收益,以平衡AI开发者和著作权人的利益,值得进一步研究和考虑。
附、 决议内容
本届大会版权议题共作出19条决议,全文如下(背景略):
1. 关于以下问题实现协调是必要的:(1)在人工智能系统训练过程中使用受著作权保护内容;(2)人工智能系统本身和(或)其输出内容是否可被认定构成侵权的影响。
人工智能系统的训练
2.使用受著作权保护的作品训练人工智能系统,需事先取得著作权人的授权,除非该使用属于以下一项或多项例外情形。
例外情形
3.使用受著作权保护的作品训练人工智能系统,应遵守根据相关司法管辖区法律中适用于其他使用受著作权保护作品的相同的例外规定,无论其是否出于商业目的,前提是符合这些例外规定的条件。
4.当使用受著作权保护的作品训练人工智能系统属于非营利性且仅出于公共利益目的时,例如非商业性的科学研究或教育,应当作为著作权侵权的一项特定例外予以允许。此项例外不应延伸适用于对经训练的人工智能系统和(或)经训练的数据集进行商业利用的情形。
5.若相关司法管辖区的法律允许未经著作权人事先授权,出于商业目的使用受著作权保护的作品训练人工智能系统,则著作权人应有权选择退出对其作品的此类使用;若著作权人未行使退出权,则应制定条款,向作品被用于训练商业利用的人工智能系统的著作权人提供经济补偿。
6.任何允许使用受著作权保护的作品训练人工智能系统的例外情形,都应符合《伯尔尼保护文学与艺术作品公约》第9条第(2)款规定的三步检验法。
透明度
7.人工智能系统提供者或训练人工智能系统的个人/实体必须:
a) 提供关于人工智能系统训练所使用的受著作权保护作品的充分信息,以使著作权人能够识别其作品被使用的情况,并行使或主张其权利;以及
b) 识别用户输入人工智能系统并被该系统用于训练的任何受著作权保护内容。
人工智能系统的输出内容
8.认定著作权侵权所适用的司法管辖区规则,应同样适用于经训练的人工智能系统的输出内容。
9.根据适用司法管辖区的精神权利法律规定,若人工智能系统的输出内容构成对作品的篡改、歪曲或其他有损作者名誉或声望的贬损行为,作者应有权在该司法管辖区提出反对。
10.人工智能系统的输出内容不应仅因其与用于训练人工智能系统的受著作权保护作品风格相同,就构成著作权侵权。
11.人工智能系统的输出内容不应仅因训练人工智能系统的行为侵犯了某作品的著作权,就构成对该作品著作权的侵权。
12.在使用受著作权保护的作品训练人工智能系统属于例外情形或已取得著作权人授权的情况下,为确定该人工智能系统的输出内容是否侵犯受著作权保护的作品,应考量例外或授权的范围。若例外或授权仅限于允许人工智能系统训练,则输出内容仍可能被认定为侵权。若例外或授权也涵盖人工智能系统所生成的内容,则输出内容不应构成侵权。
13.在以下情形,人工智能系统本身应被认定为侵权物品:a) 人工智能系统的训练使用了超过最低限度数量、非法使用的受著作权保护的内容;或 b) 该人工智能系统被专门开发用以生成侵权内容。
对输出内容侵权承担责任的个人/实体
14.若输出内容被认定侵犯著作权,根据案件的具体情况,以下一个或多个个人/实体应承担侵权责任:
a) 人工智能系统提供者,即开发人工智能系统和(或)将其投放市场的个人/实体;
b) 对人工智能系统进行商业利用的个人/实体;以及
c) 旨在生成侵权的内容而使用人工智能系统的个人/实体,例如使用详细和故意的提示词。
制裁/救济
15.若训练人工智能系统的行为侵犯了作品的著作权,著作权人应有权获得包括以下一项或多项救济:损害赔偿、禁令救济、从商业流通渠道召回以及销毁。
16.若输出内容侵犯了作品的著作权,著作权人应有权获得包括以下一项或多项救济:损害赔偿、禁令救济、从商业流通渠道召回以及销毁侵权输出内容。
17.若人工智能系统本身构成侵权物品,著作权人应有权获得包括以下一项或多项救济:损害赔偿、禁令救济、从商业流通渠道召回以及销毁人工智能系统。
18.损害赔偿金和/或对利润的评估或核算应予适用,以补偿著作权人因著作权侵权和规避著作权人同意而遭受的损害。
19.所有制裁和救济均应基于个案适用实施且合乎比例原则,以有效遏制著作权侵权行为并充分补偿著作权人。
1.详见杭州互联网法院(2024)浙0192民初1587号民事判决书。
2.ANDREA BARTZ, et al. V. ANTHROPIC PBC. (3:24-cV-05417-WHA)
3.RICHARD KADREY, et al. V. META PLATFORMS INC. (3:23-cv-03417)
4.GEMA v. OpenAI (Ref. 42 O 14139/24)
5.上海高院:《斗破苍穹》美杜莎形象被抄袭,人工智能大模型著作权侵权案一审落槌。链接:https://mp.weixin.qq.com/s/Plae0snaOEsqqmodLU9j4g

