Meta訓練其寫作生成式AI也構成合理使用?Kadrey v. Meta Platforms案判決

楊智傑/雲林科技大學 科技法律研究所 教授

0
2416

Meta因為開發其生成式AI(Gen AI) — Llama,而被十三名作家聯名提告侵害其書籍著作權。這件判決係在加州北區地院法官Alsup法官於2025年6月23日對Gen AI合理使用議題做出美國第一起判決後,由同法院的Chhabria法官在二日後,對Gen AI合理使用議題做出的第二起判決。而此次判決認為,Meta行為可構成合理使用。但也認為Gen AI介入造成書籍市場的「市場稀釋」確實是一種對著作權人的傷害。

圖片來源 : shutterstock、達志影像

Meta透過網路下載盜版書籍及納入Llama訓練資料集

Meta於2023年2月推出大型語言模型(LLM) — Llama 1,並於2024年4月推出Llama 3以及整合Llama 3的AI聊天機器人(chatbot)「Meta AI」[1]

Meta需要書籍作為Llama的訓練資料,因為書籍對AI訓練而言是高品質的訓練材料。但Meta意識到取得書籍授權難度超出預期後,開始轉而透過「影子圖書館」(shadow libraries)來取得訓練所需的書籍與其他文本。「影子圖書館」是指可免費下載書籍資料的線上資料庫,其提供內容包括書籍、學術期刊文章、音樂或影片,無論這些資料是否受著作權保護[2]

Meta將其從「影子圖書館」下載的書籍資料納入用於訓練Llama模型的資料集。Meta也對其模型進行了後訓練,以防止模型「記住」並輸出其訓練資料中的某些文字,包括受著作權保護的內容。Meta的專家證人使用一種設計誘使LLM吐出訓練資料內容的「對抗性」提示法進行測試,也無法讓任何AI模型產出超過50個字詞與標點符號(tokens)來自原告書籍的內容[3]

原告為十三名作家

原告共十三位作家,他們的作品包括劇本、短篇故事、回憶錄、散文及非小說類書籍。原告等人擁有著作權的所有書籍皆可在Meta用於訓練AI的資料集中找到。在這些資料集中,Meta共下載了至少666本原告擁有著作權的書籍副本[4]。每位原告皆表示,他們願意授權其書籍給Meta作為Gen AI訓練資料之用,但Meta從未與他們洽談過任何授權事宜[5]

原告在加州北區地院提起本訴訟,主張Meta為訓練AI複製其書籍的行為,直接造成著作權侵害。另主張用bit技術下載時,同時分享給他人下載,亦構成侵權[6]。而被告Meta請求法院對直接侵權與合理使用爭議作出即決判決[7]

合理使用分析

本案是在加州北區地院William Alsup法官於2025年6月23日對Gen AI「合理使用」議題做出美國第一起判決後[8],由同法院的Vince Chhabria法官在二日後,對Gen AI合理使用議題做出的第二起判決,以下介紹本案的合理使用四因素分析。

第一因素:具有轉化性價值

Chhabria法官認為,Meta對原告書籍的使用具有高度轉化性。Meta複製書籍的目的在於訓練其LLMs,這些模型是創新的工具,可用於產生多樣化的文本並執行各種功能。使用者可以請Llama 編輯他們撰寫的電子郵件、翻譯某段文字或將其翻譯成外語、根據假設情境編寫一段短劇,或執行其他多種任務[9]

Llama的目的並非要取代原著作或對原著作「重新包裝」。法官認為,即使使用「對抗性」提示方式讓Llama反芻其訓練資料,Llama也不會提供超過原書籍內50個單詞。而且沒有跡象表明它會生成為更長的文本內容來作為這些書籍的「重新包裝」。這些證據最多表明Meta希望Llama能夠生成某些風格的文本。但因風格不受版權保護 — 只有表達才受版權保護[10]

第二因素:高品質著作有利於原告

合理使用第二因素中,若是創意性高或具高度表現性之著作,不利於主張合理使用。而Meta之所以要選用書本作為訓練資料,就是因為書本的寫作文字風格連貫,文法正確,屬高品質的訓練資料[11]。故此因素不利於主張合理使用。

第三因素:考量到訓練必要可複製全書

法官認為,第三因素對Meta有利,即使Meta完全複製了原告的書籍。考慮到Meta訓練AI的轉化性目的,Meta複製的數量是合理的。如果LLM接受更高品質材料的訓練,確實效果更好。因此法官出於訓練AI的轉化性目的認為,將完整書籍提供給LLM訓練會比只提供半本書給LLM訓練相比,能達到更好的效果,因而認為Meta「利用整本作品」是「合理必要的」[12]

第四因素:雖然轉化性高,但仍要考量對原著作的市場替代效果

即使使用具高度轉化性,仍然會因為此類使用對原始作品市場的影響過大而不構成合理使用。在涉及將受著作權保護的作品用於訓練Gen AI模型的案件中,原告至少主張其受到三種損害[13]

直接生成原告書籍內容?

第一種損害主張是,透過Llama生成內容直接影響書籍銷售。但法官認為,在本案中,這種損害理論並不成立,因為如上所述,Llama無法讓使用者生成原告書籍中任何具意義的內容[14]

損害原告在授權AI訓練方面可獲得之授權金?

原告主張,Meta未經授權使用他們的書籍進行LLM訓練,損害了為訓練AI授權書籍的市場。雙方就是否存在或可能發展的一般書籍授權市場進行詳細討論。但法官認為,這樣的市場是否存在或可能發展並不重要,因為在主張轉化性利用時,原告根本不能主張就這個轉化性目的而認定「未收到費用」是一種損害,否則就根本無法主張轉化性利用了[15]

產生市場稀釋或間接替代?

原告的第三種主張是,使用受著作權保護的書籍來訓練LLM可能會快速生成無數與原作競爭的作品。這種損害或許可稱為「間接」替代效果,非「直接」替代效果。又或者可稱為「市場稀釋」[16]

法官認為,「市場稀釋」的現象確實已經發生。許多人利用AI協助寫作,加快了書籍的出版[17]。這些產出將減少作者的銷售,進而影響作者創作的動力,而這是《著作權法》需要防止的傷害[18]

不過,原告對於這個論點並沒有提供充足的證據。故就這一點上只能判決原告敗訴[19]。但這並不表示在其他Gen AI的爭議中不能主張「市場稀釋」損害。

不承認合理使用就會阻礙AI發展?

Meta主張,認為不承認合理使用就會阻礙AI的發展。法官表示,雖然以此案認為AI訓練可構成合理使用,但並不同意Meta上述的說法。其認為,就算不承認合理使用,Meta仍可透過支付授權金取得授權的方式得到作者同意才進行AI訓練[20]

結語

Chhabria法官最後綜合合理使用判斷四因素後,認為Meta為訓練其Gen AI的行為複製原告等人之著作構成合理使用。但值得注意的有二點:(1)「市場稀釋」是一個重要議題,只是本案的十三名原告沒有充分舉證。但未來不排除在其他合理使用爭議中,充分舉證產生「市場稀釋」效果而認為不構成合理使用;(2)法官雖承認可構成合理使用,但並不認為「發展訓練AI之著作授權市場」是完全不可能的。

延伸閱讀:

  1. 美國第一起生成式AI構成合理使用判決:加州北區地院Bartz v. Anthropic PBC案

備註:

  1. [1] Kadrey v. Meta Platforms, Inc., No. 23-CV-03417-VC, 2025 WL 1752484, at *5 (N.D. Cal. June 25, 2025).
  2. [2] Id. at *6.
  3. [3] Id. at *7.
  4. [4] Id. at *7.
  5. [5] Id. at *8.
  6. [6] Id. at *8.
  7. [7] Id. at *8.
  8. [8] 由北美智權報/楊智傑整理並發表於北美智權報384期:《美國第一起生成式AI構成合理使用判決:加州北區地院Bartz v. Anthropic PBC案》。
  9. [9] Id. at *9.
  10. [10] Id. at *10.
  11. [11] Id. at *14.
  12. [12] Id. at *14.
  13. [13] Id. at *15.
  14. [14] Id. at *15.
  15. [15] Id. at *16.
  16. [16] Id. at *16.
  17. [17] Id. at *17.
  18. [18] Id. at *17-18.
  19. [19] Id. at *20.
  20. [20] Id. at *22.

責任編輯:盧頎

【本文僅反映專家作者意見,不代表本報立場。】

作者: 楊智傑
現任: 雲林科技大學科技法律所 教授
經歷: 真理大學法律系助理教授
真理大學法律系副教授
學歷: 台灣大學法律系
中央大學產業經濟所碩士
台灣大學法學博士
專長: 智慧財產權、美國專利法、美國著作權法、憲法

智權報385期文章列表

吳碧娥 《2025亞洲生技大展》2025 BIO ASIA完美落幕,AI創新成果展現台灣智慧醫療與生醫研發實力
吳碧娥 《2025亞洲生技大展》2025 BIO ASIA 展出亮點:廠商篇
吳碧娥 《2025亞洲生技大展》生技中心執行長李財坤專訪:生技中心獲2025 BIO ASIA AWARD組織大獎桂冠
李淑蓮 台灣生醫雙星齊耀桃園:2025 ISOMRM 與 BIOMED-X 強強聯手,共創醫療創新未來
李淑蓮 「國防自主 × AI創新」:2025台北航太暨國防展9月登場,引領亞太科技防衛新紀元
李淑蓮 在地緣政治陰影下逆風求生 ─ 台灣企業的永續創新與全球再布局戰略
葉雪美 《東協工業設計實質審查的共通指南》工業設計註冊的形式要件 — 4:產品說明、分類與標示
蔡佑駿 轟動一時的Trump關稅政策真的引發美國通貨膨脹問題?或許結果並不如經濟學者預期
盧頎 傳授健康長壽新對策! 2025國衛院科普論壇「長者生活指南」
吳碧娥 台灣在全球關稅海嘯下淨零因應對策
黃鐙輝 從四個事件看AI正在推動社會改變
黃蘭閔 PCT案進入EPO收Rule 161/162 communication 可以不回覆嗎?
楊智傑 Meta訓練其寫作生成式AI也構成合理使用?Kadrey v Meta Platforms案判決
喻韜 由G 1/24號決定看EPO與USPTO在解釋請求項上的實務差異
陳秉訓 以美《專利法》第284條判例法為基礎,從Paper案判決反觀台灣專利侵權在損害賠償上的計算
許慈真 後註冊商標的混淆誤認與假冒案例:新加坡商標判決Sunrise Plus v Sunrider

發表留言

請輸入您的評論!
請在此輸入您的姓名