Meta訓練其寫作生成式AI也構成合理使用？Kadrey v. Meta Platforms案判決

楊智傑／雲林科技大學科技法律研究所教授

2025 年 8 月 1 日

3454

Meta因為開發其生成式AI（Gen AI） — Llama，而被十三名作家聯名提告侵害其書籍著作權。這件判決係在加州北區地院法官Alsup法官於2025年6月23日對Gen AI合理使用議題做出美國第一起判決後，由同法院的Chhabria法官在二日後，對Gen AI合理使用議題做出的第二起判決。而此次判決認為，Meta行為可構成合理使用。但也認為Gen AI介入造成書籍市場的「市場稀釋」確實是一種對著作權人的傷害。

Meta透過網路下載盜版書籍及納入Llama訓練資料集

Meta於2023年2月推出大型語言模型（LLM） — Llama 1，並於2024年4月推出Llama 3以及整合Llama 3的AI聊天機器人（chatbot）「Meta AI」[1]。

Meta需要書籍作為Llama的訓練資料，因為書籍對AI訓練而言是高品質的訓練材料。但Meta意識到取得書籍授權難度超出預期後，開始轉而透過「影子圖書館」（shadow libraries）來取得訓練所需的書籍與其他文本。「影子圖書館」是指可免費下載書籍資料的線上資料庫，其提供內容包括書籍、學術期刊文章、音樂或影片，無論這些資料是否受著作權保護[2]。

Meta將其從「影子圖書館」下載的書籍資料納入用於訓練Llama模型的資料集。Meta也對其模型進行了後訓練，以防止模型「記住」並輸出其訓練資料中的某些文字，包括受著作權保護的內容。Meta的專家證人使用一種設計誘使LLM吐出訓練資料內容的「對抗性」提示法進行測試，也無法讓任何AI模型產出超過50個字詞與標點符號（tokens）來自原告書籍的內容[3]。

原告為十三名作家

原告共十三位作家，他們的作品包括劇本、短篇故事、回憶錄、散文及非小說類書籍。原告等人擁有著作權的所有書籍皆可在Meta用於訓練AI的資料集中找到。在這些資料集中，Meta共下載了至少666本原告擁有著作權的書籍副本[4]。每位原告皆表示，他們願意授權其書籍給Meta作為Gen AI訓練資料之用，但Meta從未與他們洽談過任何授權事宜[5]。

原告在加州北區地院提起本訴訟，主張Meta為訓練AI複製其書籍的行為，直接造成著作權侵害。另主張用bit技術下載時，同時分享給他人下載，亦構成侵權[6]。而被告Meta請求法院對直接侵權與合理使用爭議作出即決判決[7]。

合理使用分析

本案是在加州北區地院William Alsup法官於2025年6月23日對Gen AI「合理使用」議題做出美國第一起判決後[8]，由同法院的Vince Chhabria法官在二日後，對Gen AI合理使用議題做出的第二起判決，以下介紹本案的合理使用四因素分析。

第一因素：具有轉化性價值

Chhabria法官認為，Meta對原告書籍的使用具有高度轉化性。Meta複製書籍的目的在於訓練其LLMs，這些模型是創新的工具，可用於產生多樣化的文本並執行各種功能。使用者可以請Llama 編輯他們撰寫的電子郵件、翻譯某段文字或將其翻譯成外語、根據假設情境編寫一段短劇，或執行其他多種任務[9]。

Llama的目的並非要取代原著作或對原著作「重新包裝」。法官認為，即使使用「對抗性」提示方式讓Llama反芻其訓練資料，Llama也不會提供超過原書籍內50個單詞。而且沒有跡象表明它會生成為更長的文本內容來作為這些書籍的「重新包裝」。這些證據最多表明Meta希望Llama能夠生成某些風格的文本。但因風格不受版權保護 — 只有表達才受版權保護[10]。

第二因素：高品質著作有利於原告

合理使用第二因素中，若是創意性高或具高度表現性之著作，不利於主張合理使用。而Meta之所以要選用書本作為訓練資料，就是因為書本的寫作文字風格連貫，文法正確，屬高品質的訓練資料[11]。故此因素不利於主張合理使用。

第三因素：考量到訓練必要可複製全書

法官認為，第三因素對Meta有利，即使Meta完全複製了原告的書籍。考慮到Meta訓練AI的轉化性目的，Meta複製的數量是合理的。如果LLM接受更高品質材料的訓練，確實效果更好。因此法官出於訓練AI的轉化性目的認為，將完整書籍提供給LLM訓練會比只提供半本書給LLM訓練相比，能達到更好的效果，因而認為Meta「利用整本作品」是「合理必要的」[12]。

第四因素：雖然轉化性高，但仍要考量對原著作的市場替代效果

即使使用具高度轉化性，仍然會因為此類使用對原始作品市場的影響過大而不構成合理使用。在涉及將受著作權保護的作品用於訓練Gen AI模型的案件中，原告至少主張其受到三種損害[13]：

直接生成原告書籍內容？

第一種損害主張是，透過Llama生成內容直接影響書籍銷售。但法官認為，在本案中，這種損害理論並不成立，因為如上所述，Llama無法讓使用者生成原告書籍中任何具意義的內容[14]。

損害原告在授權AI訓練方面可獲得之授權金？

原告主張，Meta未經授權使用他們的書籍進行LLM訓練，損害了為訓練AI授權書籍的市場。雙方就是否存在或可能發展的一般書籍授權市場進行詳細討論。但法官認為，這樣的市場是否存在或可能發展並不重要，因為在主張轉化性利用時，原告根本不能主張就這個轉化性目的而認定「未收到費用」是一種損害，否則就根本無法主張轉化性利用了[15]。

產生市場稀釋或間接替代？

原告的第三種主張是，使用受著作權保護的書籍來訓練LLM可能會快速生成無數與原作競爭的作品。這種損害或許可稱為「間接」替代效果，非「直接」替代效果。又或者可稱為「市場稀釋」[16]。

法官認為，「市場稀釋」的現象確實已經發生。許多人利用AI協助寫作，加快了書籍的出版[17]。這些產出將減少作者的銷售，進而影響作者創作的動力，而這是《著作權法》需要防止的傷害[18]。

不過，原告對於這個論點並沒有提供充足的證據。故就這一點上只能判決原告敗訴[19]。但這並不表示在其他Gen AI的爭議中不能主張「市場稀釋」損害。

不承認合理使用就會阻礙AI發展？

Meta主張，認為不承認合理使用就會阻礙AI的發展。法官表示，雖然以此案認為AI訓練可構成合理使用，但並不同意Meta上述的說法。其認為，就算不承認合理使用，Meta仍可透過支付授權金取得授權的方式得到作者同意才進行AI訓練[20]。

結語

Chhabria法官最後綜合合理使用判斷四因素後，認為Meta為訓練其Gen AI的行為複製原告等人之著作構成合理使用。但值得注意的有二點：（1）「市場稀釋」是一個重要議題，只是本案的十三名原告沒有充分舉證。但未來不排除在其他合理使用爭議中，充分舉證產生「市場稀釋」效果而認為不構成合理使用；（2）法官雖承認可構成合理使用，但並不認為「發展訓練AI之著作授權市場」是完全不可能的。

智權報385期文章列表

吳碧娥	《2025亞洲生技大展》2025 BIO ASIA完美落幕，AI創新成果展現台灣智慧醫療與生醫研發實力
吳碧娥	《2025亞洲生技大展》2025 BIO ASIA 展出亮點：廠商篇
吳碧娥	《2025亞洲生技大展》生技中心執行長李財坤專訪：生技中心獲2025 BIO ASIA AWARD組織大獎桂冠
李淑蓮	台灣生醫雙星齊耀桃園：2025 ISOMRM 與 BIOMED-X 強強聯手，共創醫療創新未來
李淑蓮	「國防自主 × AI創新」：2025台北航太暨國防展9月登場，引領亞太科技防衛新紀元
李淑蓮	在地緣政治陰影下逆風求生 ─ 台灣企業的永續創新與全球再布局戰略
葉雪美	《東協工業設計實質審查的共通指南》工業設計註冊的形式要件 — 4：產品說明、分類與標示
蔡佑駿	轟動一時的Trump關稅政策真的引發美國通貨膨脹問題？或許結果並不如經濟學者預期
盧頎	傳授健康長壽新對策！ 2025國衛院科普論壇「長者生活指南」
吳碧娥	台灣在全球關稅海嘯下淨零因應對策
黃鐙輝	從四個事件看AI正在推動社會改變
黃蘭閔	PCT案進入EPO收Rule 161/162 communication 可以不回覆嗎？
楊智傑	Meta訓練其寫作生成式AI也構成合理使用？Kadrey v Meta Platforms案判決
喻韜	由G 1/24號決定看EPO與USPTO在解釋請求項上的實務差異
陳秉訓	以美《專利法》第284條判例法為基礎，從Paper案判決反觀台灣專利侵權在損害賠償上的計算
許慈真	後註冊商標的混淆誤認與假冒案例：新加坡商標判決Sunrise Plus v Sunrider