
德国音乐演出与作品重制权协会(GEMA)代表九位歌词作者,对OpenAI所属两家公司提供的聊天机器人(chatbot)服务「ChatGPT」提出侵权主张,主张OpenAI在大型语言模型(LLMs)中储存和生成内容中,均侵害九位歌词作者的歌词版权。德国慕尼黑第一地方法院(下称慕尼黑地院)第42民事庭于2025年11月11日作出判决,认定GEMA大部分主张胜诉。至于生成内容未做姓名标示而侵害人格权部分,法院认为不成立。
本案原告为GEMA所代表的九位歌词作者
以下以慕尼黑地院在该案判决当天所提供新闻稿为主,对该案进行介绍[1]。
原告GEMA为德国最重要、也是全欧洲最大的音乐版权集体管理组织。而音乐著作包括了歌词和歌曲。本判决涉及九位知名德国作词、作曲者的歌曲及歌词。GEMA以管理者身分代替歌词作者向OpenAI提起诉讼[2]。
原告主张,被告的LLMs模型已将这些歌曲歌词「记忆化」(memorisation),并在用户使用ChatGPT提出简单询问时,于生成内容(outputs)中大量、近乎原样地输出这些歌词[3]。
被告公司OpenAI为LLMs及其上运作之ChatGPT的营运者。被告辩称,他们的LLMs并不会储存或复制具体的训练数据,而仅是在参数中反映LLMs从整体训练数据集中学习到的模式。且因生成内容系由用户输入提示词(prompts)后才生成,因此「输出内容的制作者」为个别用户,而非被告。此外,即便有权利侵害,也受到德国版权例外规定(台湾习惯称合理使用)的保护,尤其是「文字与数据探勘例外」(Text and Data Mining exception, TDM)[4]的部分。
将歌词记忆化构成重制
但慕尼黑地院第42庭认为,不论是在LLMs中的「记忆化」,或ChatGPT在生成内容中重现歌词,两者皆构成对著作财产权中利用权的侵害[5]。
合议庭确信,系争歌曲歌词已再现地(reproducible)被包含在被告的ChatGPT GPT-4与GPT-4o中。信息技术研究显示,训练数据可能存在于LLMs中,并可经由生成内容重新提取,这即被称为「记忆化」。亦即,LLMs在训练过程中,不仅从训练数据中提取信息,且在训练后的特定参数(specified parameters)中保留了训练数据的完整内容[6]。
本案中,法院透过将训练数据中包含的歌词与模型输出之内容加以比对,确认存在此种记忆化现象。基于相关歌词的复杂性与篇幅,法院不认为该歌词现在生成内容中的原因是「随机巧合」[7]。
透过「记忆化」,LLMs特定参数中所储存的数据,构成版权上「重制」行为所要求的「具体化/固着」(embodiment / fixation)要件。系争的歌曲歌词已以可再现的方式固着于LLMs之中。依据《信息社会指令》(InfoSoc Directive)第2条,重制(reproduction)可以是「任何方式、任何形式」的重制。歌词以「机率值」(probability values)的形式被固着,并不影响其构成重制[8]。
依InfoSoc第2条与德国《版权法》第16条,LLMs等新兴科技同样受复制权规范。依据欧盟(EU)法院的判例,只要达到「间接可感知性」(indirect perceptibility),即可构成重制行为;亦即,只要能透过技术手段使作品被感知,即符合重制的要件[9]。
此种重制行为不受TDM保护
德国《版权法》落实EU2019年数字单一市场版权指令,有两条TDM的例外条款。但因为ChatGPT是商业服务,只能主张第44b条的一般TSM条款。
合议庭认为,LLMs原则上确实落入TDM例外规定的适用范围。该等规范旨在允许为建立训练所需之数据库而进行的「必要复制」行为,例如:将作品转制为另一种(数字)格式、或在内存中暂时储存等。其立法背景在于:这些复制行为仅是为了后续自动化分析所需,其本身并不影响著作人的经济利用利益。既然这些TDM的「纯准备性行为」不涉及对作品的利用,因此法律并未要求向版权人支付报酬[10]。
然而,若在训练过程中,LLMs不仅「提取信息」,而是「复制了作品本身」,则依本院之见解,此行为便不属于TDM。TDM与其例外规定的基本前提,是系统仅对「信息」进行自动化处理,并未涉及作品本身的经济利用利益。然而本案情况正相反:LLMs中的重制行为已经实质侵害权利人之利用权[11]。
另一种可能较符合科技与创新导向的宽松解释,即认为LLMs中的重制,亦可受到TDM例外的保护。但合议庭认为法条文字和意旨来看,并不包括在LLMs中重制[12]。
另外,合议庭也认为不存在类推适用的空间。即便主张这是立法上存在「未预期的漏洞」,立法当时尚未意识到「记忆化」以及随之而来、在LLMs中持续存在的、具有版权意义的重制行为,仍然欠缺进行类推所需的「可比较的利益」(comparable interests)[13]。TDM例外允许的,是在「不危及著作人利用利益」之情况下,为分析目的所作的准备性复制行为,其前提就是只抽取信息、而不复制作品本身。然而,LLMs中的复制行为却会持续影响作品的经济利用,并损害权利人之正当利益。若在此情况下仍对例外规定做类推适用,而例外规定又不要求支付任何报酬,那么著作人与权利人将完全丧失保护。此外,记忆化的风险完全源自被告的行为领域。若例外规定被类推适用,则唯一承担风险者将是受侵害的权利人[14]。
不符合附带利用之例外
另外,被告另主张德国《版权法》第57条的附带利用之例外:「若某作品仅属于与实际被重制、散布或公开传达之主题相关的附带性部分,则该作品得被合法重制、散布或公开传达。」典型的情况为,在拍摄街景影片中,附带第拍摄到商店橱窗里的海报、书籍封面、绘画等他人著作。
但合议庭认为,本案不存在一个「主作品」,因此,系争歌词的重制行为并不构成德国《版权法》第57条所称的「非实质性附带成分」。与被告的主张相反,系争歌词相对于整个训练数据集,不能被视为次要且可有可无。若要成立「附带性作品」,前提必须是整个训练数据集本身也构成受版权保护的作品[15]。
另外,被告对原告利用权的侵害,也不能以权利人已默示同意为理由加以正当化。LLMs训练并非权利人应被推定为可预见或通常会允许的利用方式[16]。
利用的责任主体应为被告而非用户
此外,合议庭认为,被告透过ChatGPT在生成内容中重新呈现歌曲歌词的行为,同样构成对系争歌词之「未经授权的重制」与「公开提供」(public communication / making available to the public)。歌词中的独创性要素在输出内容中均可辨识[17]。
上述行为的责任主体是被告,而非用户。因为这些生成输出是透过简单的提示词所生成。被告营运LLMs,并由他们选定并使用歌词作为训练数据。他们亦掌控LLMs架构并对训练数据的记忆化负责。因此,由被告营运的LLMs对输出内容具有决定性影响;输出的具体内容由LLMs本身生成[18]。
结语
目前,本案仍可继续上诉。笔者认为,LLMs生成侵害歌词的内容,较为明确。但LLMs记住歌词,是否就当然不符合TDM例外,仍有争论空间。若认为不准LLMs记住,将导致整个LLMs都无法继续存在 — 对此观点,OpenAI公司也势必会提出上诉。
备注:
- [1] Landgericht München I, Press Release No. 11/2025, Urteil GEMA gegen OpenAI (Nov. 11, 2025), https://www.justiz.bayern.de/gerichte-und-behoerden/landgericht/muenchen-1/presse/2025/11.php.
- [2] Id.
- [3] Id.
- [4] Id.
- [5] Id.
- [6] Id.
- [7] Id.
- [8] Id.
- [9] Id.
- [10] Id.
- [11] Id.
- [12] Id.
- [13] Id.
- [14] Id.
- [15] Id.
- [16] Id.
- [17] Id.
- [18] Id.
责任编辑:卢颀
【本文仅反映专家作者意见,不代表本报立场。】
|















