由GEMA v. OpenAI案判决看德国慕尼黑法院对ChatGPT生成内容侵害歌词版权认定

杨智杰／云林科技大学科技法律研究所教授

2025 年 12 月 1 日

1534

德国音乐演出与作品重制权协会（GEMA）代表九位歌词作者，对OpenAI所属两家公司提供的聊天机器人（chatbot）服务「ChatGPT」提出侵权主张，主张OpenAI在大型语言模型（LLMs）中储存和生成内容中，均侵害九位歌词作者的歌词版权。德国慕尼黑第一地方法院（下称慕尼黑地院）第42民事庭于2025年11月11日作出判决，认定GEMA大部分主张胜诉。至于生成内容未做姓名标示而侵害人格权部分，法院认为不成立。

本案原告为GEMA所代表的九位歌词作者

以下以慕尼黑地院在该案判决当天所提供新闻稿为主，对该案进行介绍[1]。

原告GEMA为德国最重要、也是全欧洲最大的音乐版权集体管理组织。而音乐著作包括了歌词和歌曲。本判决涉及九位知名德国作词、作曲者的歌曲及歌词。GEMA以管理者身分代替歌词作者向OpenAI提起诉讼[2]。

原告主张，被告的LLMs模型已将这些歌曲歌词「记忆化」（memorisation），并在用户使用ChatGPT提出简单询问时，于生成内容（outputs）中大量、近乎原样地输出这些歌词[3]。

被告公司OpenAI为LLMs及其上运作之ChatGPT的营运者。被告辩称，他们的LLMs并不会储存或复制具体的训练数据，而仅是在参数中反映LLMs从整体训练数据集中学习到的模式。且因生成内容系由用户输入提示词（prompts）后才生成，因此「输出内容的制作者」为个别用户，而非被告。此外，即便有权利侵害，也受到德国版权例外规定（台湾习惯称合理使用）的保护，尤其是「文字与数据探勘例外」（Text and Data Mining exception, TDM）[4]的部分。

将歌词记忆化构成重制

但慕尼黑地院第42庭认为，不论是在LLMs中的「记忆化」，或ChatGPT在生成内容中重现歌词，两者皆构成对著作财产权中利用权的侵害[5]。

合议庭确信，系争歌曲歌词已再现地（reproducible）被包含在被告的ChatGPT GPT-4与GPT-4o中。信息技术研究显示，训练数据可能存在于LLMs中，并可经由生成内容重新提取，这即被称为「记忆化」。亦即，LLMs在训练过程中，不仅从训练数据中提取信息，且在训练后的特定参数（specified parameters）中保留了训练数据的完整内容[6]。

本案中，法院透过将训练数据中包含的歌词与模型输出之内容加以比对，确认存在此种记忆化现象。基于相关歌词的复杂性与篇幅，法院不认为该歌词现在生成内容中的原因是「随机巧合」[7]。

透过「记忆化」，LLMs特定参数中所储存的数据，构成版权上「重制」行为所要求的「具体化／固着」（embodiment / fixation）要件。系争的歌曲歌词已以可再现的方式固着于LLMs之中。依据《信息社会指令》（InfoSoc Directive）第2条，重制（reproduction）可以是「任何方式、任何形式」的重制。歌词以「机率值」（probability values）的形式被固着，并不影响其构成重制[8]。

依InfoSoc第2条与德国《版权法》第16条，LLMs等新兴科技同样受复制权规范。依据欧盟（EU）法院的判例，只要达到「间接可感知性」（indirect perceptibility），即可构成重制行为；亦即，只要能透过技术手段使作品被感知，即符合重制的要件[9]。

此种重制行为不受TDM保护

德国《版权法》落实EU2019年数字单一市场版权指令，有两条TDM的例外条款。但因为ChatGPT是商业服务，只能主张第44b条的一般TSM条款。

合议庭认为，LLMs原则上确实落入TDM例外规定的适用范围。该等规范旨在允许为建立训练所需之数据库而进行的「必要复制」行为，例如：将作品转制为另一种（数字）格式、或在内存中暂时储存等。其立法背景在于：这些复制行为仅是为了后续自动化分析所需，其本身并不影响著作人的经济利用利益。既然这些TDM的「纯准备性行为」不涉及对作品的利用，因此法律并未要求向版权人支付报酬[10]。

然而，若在训练过程中，LLMs不仅「提取信息」，而是「复制了作品本身」，则依本院之见解，此行为便不属于TDM。TDM与其例外规定的基本前提，是系统仅对「信息」进行自动化处理，并未涉及作品本身的经济利用利益。然而本案情况正相反：LLMs中的重制行为已经实质侵害权利人之利用权[11]。

另一种可能较符合科技与创新导向的宽松解释，即认为LLMs中的重制，亦可受到TDM例外的保护。但合议庭认为法条文字和意旨来看，并不包括在LLMs中重制[12]。

另外，合议庭也认为不存在类推适用的空间。即便主张这是立法上存在「未预期的漏洞」，立法当时尚未意识到「记忆化」以及随之而来、在LLMs中持续存在的、具有版权意义的重制行为，仍然欠缺进行类推所需的「可比较的利益」（comparable interests）[13]。TDM例外允许的，是在「不危及著作人利用利益」之情况下，为分析目的所作的准备性复制行为，其前提就是只抽取信息、而不复制作品本身。然而，LLMs中的复制行为却会持续影响作品的经济利用，并损害权利人之正当利益。若在此情况下仍对例外规定做类推适用，而例外规定又不要求支付任何报酬，那么著作人与权利人将完全丧失保护。此外，记忆化的风险完全源自被告的行为领域。若例外规定被类推适用，则唯一承担风险者将是受侵害的权利人[14]。

不符合附带利用之例外

另外，被告另主张德国《版权法》第57条的附带利用之例外：「若某作品仅属于与实际被重制、散布或公开传达之主题相关的附带性部分，则该作品得被合法重制、散布或公开传达。」典型的情况为，在拍摄街景影片中，附带第拍摄到商店橱窗里的海报、书籍封面、绘画等他人著作。

但合议庭认为，本案不存在一个「主作品」，因此，系争歌词的重制行为并不构成德国《版权法》第57条所称的「非实质性附带成分」。与被告的主张相反，系争歌词相对于整个训练数据集，不能被视为次要且可有可无。若要成立「附带性作品」，前提必须是整个训练数据集本身也构成受版权保护的作品[15]。

另外，被告对原告利用权的侵害，也不能以权利人已默示同意为理由加以正当化。LLMs训练并非权利人应被推定为可预见或通常会允许的利用方式[16]。

利用的责任主体应为被告而非用户

此外，合议庭认为，被告透过ChatGPT在生成内容中重新呈现歌曲歌词的行为，同样构成对系争歌词之「未经授权的重制」与「公开提供」（public communication / making available to the public）。歌词中的独创性要素在输出内容中均可辨识[17]。

上述行为的责任主体是被告，而非用户。因为这些生成输出是透过简单的提示词所生成。被告营运LLMs，并由他们选定并使用歌词作为训练数据。他们亦掌控LLMs架构并对训练数据的记忆化负责。因此，由被告营运的LLMs对输出内容具有决定性影响；输出的具体内容由LLMs本身生成[18]。

结语

目前，本案仍可继续上诉。笔者认为，LLMs生成侵害歌词的内容，较为明确。但LLMs记住歌词，是否就当然不符合TDM例外，仍有争论空间。若认为不准LLMs记住，将导致整个LLMs都无法继续存在 — 对此观点，OpenAI公司也势必会提出上诉。

备注：

[1] Landgericht München I, Press Release No. 11/2025, Urteil GEMA gegen OpenAI (Nov. 11, 2025), https://www.justiz.bayern.de/gerichte-und-behoerden/landgericht/muenchen-1/presse/2025/11.php.
[2] Id.
[3] Id.
[4] Id.
[5] Id.
[6] Id.
[7] Id.
[8] Id.
[9] Id.
[10] Id.
[11] Id.
[12] Id.
[13] Id.
[14] Id.
[15] Id.
[16] Id.
[17] Id.
[18] Id.

责任编辑：卢颀

【本文仅反映专家作者意见，不代表本报立场。】

作者：	杨智杰
现任：	云林科技大学科技法律所教授
经历：	云林科技大学科技法律所副教授真理大学法律系助理教授真理大学法律系副教授
学历：	台湾大学法律系中央大学产业经济所硕士台湾大学法学博士
专长：	知识产权、美国专利法、美国著作权法、宪法

LEAVE A REPLY Cancel reply