美國加州北區聯邦地方法院法官William Alsup於2025年6月23日作成初步判決,認為生成式人工智慧(Gen AI)軟體開發公司Anthropic PBC因下載盜版書籍建立訓練AI用中央資料庫而不構成合理使用後,法官Alsup也同意本案成立集體訴訟,預估將有50萬名原告都可以對Anthropic提告。因而Anthropic提出一項和解方案 — 願意對其使用Gen AI訓練的每一本書均賠償3,000美元,其總共要承擔15億美元的預估賠償。

Bartz v. Anthropic PBC案初步判決
如我們之前在北美智權報384期所介紹[1],Bartz v. Anthropic PBC案是由三位書籍作者(Bartz)針對未經授權使用書籍訓練大型語言(LLMs)模型公司Anthropic而提起的侵權訴訟。該案中,Anthropic在使用圖書檔案訓練其AI模型 — Claude有二個階段,
第一個階段,是從網路上的盜版書籍資料庫LibGen與PiLiMi下載 — 從LibGen下載了至少500萬本書籍、從PiLiMi則是下載了至少200萬本書籍[2]。
第二個階段,Anthropic決定自己購買圖書,然後將這些紙本書籍拆裝後逐頁掃描。
2025年6月23日,加州北區地院法官Alsup作出簡易判決,認定Anthropic以圖書檔案進行AI模型訓練,不論訓練資料來源是盜版還是自己購買紙本書拆裝後掃描,此行為均屬於合理使用。但將蒐集的圖書檔案存放在其建置中央資料庫的行為,則有不同認定,如下,
(1)若訓練資料屬自己花錢購買,然後逐頁掃描成數位檔案,在訓練AI後存放在中央資料庫,可構成合理使用。
(2)若訓練資料來自網路的盜版資料庫,則訓練AI後存放在中央資料庫,不構成合理使用[3]。
集體訴訟與和解方案
2025年7月17日,法官Alsup核准本案為全美範圍的集體訴訟(class action)[4],亦即原來的三位原告乃代表所有Anthropic從LibGen或PiLiMi資料庫下載書籍版本之實質與合法著作權人。只要這些原告的書籍在被Anthropic下載前或出版後三個月內向美國著作權局(U. S. Copyright office)完成登記;並且具有ISBN或ASIN編號均可向Anthropic提告。實際上,在約700萬本被Anthropic下載的書籍中,只有約50萬本符合這些條件[5]。
2025年9月,在經過由中立第三方調解人主持的「雙方公平協商」後,原告與被告雙方達成了擬議的和解協議。該和解協議於2025年9月25日經法官Alsup初步核准[6],並對外公開徵求,這50萬名書本的作者是否願意接受該和解條件[7]。
根據公開的協議內容,Anthropic為這項協議大約要付出15億和解美金。其具體約定,Anthropic對每本書籍的賠償金額為3,000美元。但作者將來實際拿到的錢,尚須扣除成本、律師費及其他費用等。其也提到,倘若參加的原告並非自己擁有完整的著作權,例如著作權是由作者和出版社共享,則這筆賠償金即需在作者和出版社之間分配。這個和解的範圍,只限於對Anthropic過去侵權行為,並不包括其所開發的Claude之後的生成內容的潛在侵權問題。
在集體訴訟徵求原告的公告中,符合資格的作者,有四個選項:(1)於2026年3月23日前提交有效的請求以領取款項;(2)於2026年1月7日前選擇退出集體訴訟;(3)於2026年1月7日前提出異議以表達反對意見;(4)或不採取任何行動[8]。
一本書賠償可高達3,000美元?
此處須說明,依美國《著作權法》第504條(c)規定,透過訴訟請求的賠償金,若非以真正損害來求償,而是以法定賠償金來求償,則最低一項侵權賠償不得低於750美元,最高不得高於3萬美元[9]。但若原告能證明被告是蓄意侵權的話,法院可將法定賠償金調高到最高 — 例如,一本著作可求償15萬美元[10]。
為何Anthropic的和解方案最後選擇每本書賠償3,000美元?可能是受到美《著作權法》法定賠償金的影響。雖然法定賠償金最低750美元,但因為初步判決已經認定被告是「在知道這些網路圖書資料庫是屬於盜版的情況下」下載、使用,此行為可能會構成蓄意侵權。因此,Anthropic和解方案所提出每本書3,000美元的賠償金,是美《著作權法》法定賠償金750美元的四倍。
既然如此,其他潛在原告可否選擇不加入此訴訟,而改為自己提告,想辦法拿到最高可能15萬美元的法定賠償金?這很難。因為在美國打官司的成本也非常高。審判可能曠日費時,並歷經多年上訴,且無法保證全額賠償[11]。因此,對潛在原告而言,選擇一本書3,000美元的和解金,也許是一個可接受的方案。
對未來訴訟與授權制度的影響
一般認為,Anthropic的和解方案很可能成為其他著作權人針對AI公司提出著作權訴訟的參考基準。其他原告可能會以每件作品約3,000美元為起點進行損害賠償談判,未來法院在設計救濟措施時也可能參照本案的結構[12]。
Anthropic提出的和解條件,也可能增加未來AI開發公司取得合法授權之訓練資料的意願[13]。一本圖書在美國可能價格為30美元,如果盜版一本書用作AI訓練,最後居然要賠償該本書的100倍價錢,還不如一開始就接受100倍以下的AI訓練用授權金。如美國Ropes & Gray律師事務所認為,AI開發商將越來越傾向主動尋求授權協議,藉此以「市場價格」支付權利金,而非冒著法定損害賠償風險進行非法使用[14]。
若是合法購買圖書自己數位化或下載合法檔案呢?
若比對Anthropic後期取得圖書檔案的來源,形成一明顯對比 — 一本圖書在美國可能價格為30美元,但Anthropic和解方案中的每本書須賠償3,000美元,是購買合法圖書價金的100倍。
法官Alsup在Bartz v. Anthropic PBC案認為「以合法購買書籍進行數位化後建立資料庫留存」屬合理使用。那麼,是否當初用30美元買書就比較省錢?但Anthropic採購合法圖書後,仍須自己拆解圖書進行逐頁掃描 — 尚需投入機械、人力、時間等成本。因此,若自行購買上百萬本書然後拆開逐一掃瞄成數位檔,所需支付的成本也不可小覷。
如果是購買某合法圖書資料庫的個人版,下載全部圖書檔案後,轉為作AI訓練並建立資料庫,這樣是否算是合法取得數位檔案?由於資料庫的授權使用契約中會約定用途,若購買的是個人版(非商用)卻大量下載作AI訓練(商用),算是違反該資料庫的授權契約。
對小型新創AI開發者不利?
由於Anthropic是開發Claude的公司,進入市場相對早,且也與大公司包括Microsoft合作,目前早已商業化,擁有充足資金。Anthropic於2025年9月的估值高達1,830億美元,因此15億美元的賠償金對於該公司來說仍在可負擔範圍[15]。
但對其他尚未獲利的AI新創公司,如何有辦法支付高額訓練資料的授權金?這樣的發展是否對小型AI新創公司不利?
這裡要注意一項重要的區別 — 不論法官Alsup在Bartz v. Anthropic PBC案初步判決,和同法院另一名法官Vince Chhabria在Kadrey v. Meta Platforms案之初步判決[16],都認為AI開發公司下載盜版檔案進行AI訓練,可構成合理使用。而上述討論、針對的,是指AI開發公司在訓練AI後仍將訓練資料「保留」的行為,而此行為才被認定不構成合理使用的情況。
也就是說,對尚未獲利的小型AI開發公司,若不想被認定侵權,只要在訓練AI之後立即刪除訓練資料,就不會有問題。不過,若不能留存訓練資料,在每一次的AI訓練就必須重新蒐集、整理訓練資料,對後續新的AI開發者而言,確實仍然是一個阻礙。
延伸閱讀:
備註:
- [1] 楊智傑,美國第一起生成式AI構成合理使用判決:加州北區地院Bartz v. Anthropic PBC案,北美智權報,384期,2025年7月16日。
- [2] Bartz v. Anthropic PBC, No. C 24-05417 WHA, 2025 WL 1741691, at *2(N.D. Cal. June 23, 2025).
- [3] Id. at *8-18.
- [4] Bartz v. Anthropic PBC, No. C 24-05417 WHA, Order on Class Certification, N.D. Cal., Jul 17, 2025.
- [5] Harsh Gour, Bartz v. Anthropic: All you need to know about the largest copyright settlement in history, The Leaflet, 27 Sep 2025, https://theleaflet.in/digital-rights/law-and-technology/bartz-v-anthropic-all-you-need-to-know-about-the-largest-copyright-settlement-in-history.
- [6] Bartz v. Anthropic PBC, Case No. 3:24-cv-05417-WHA, Class Action Settlement Agreement, N.D. Cal., Sep. 25, 2025.
- [7] Bartz v. Anthropic PBC, No. 3:24-cv-05417-WHA, Notice of $1.5 Billion Proposed Class Action Settlement Between Authors & Publishers and Anthropic PBC, N.D. Cal., Oct 1, 2025.
- [8] Id.
- [9] 17 U.S.C. § 504(c)(1).
- [10] 17 U.S.C. § 504(c)(2).
- [11] Harsh Gour, supra note 5.
- [12] Penti et al., supra note 12.
- [13] Regina Sam Penti, Matthew J. Rizzolo, Yam Schaal, Anthropic’s Landmark Copyright Settlement: Implications for AI Developers and Enterprise Users, September 8, 2025, https://www.ropesgray.com/en/insights/alerts/2025/09/anthropics-landmark-copyright-settlement-implications-for-ai-developers-and-enterprise-users.
- [14] Penti et al., supra note 12.
- [15] Harsh Gour, supra note 5.
- [16] Kadrey v. Meta Platforms, Inc., No. 23-CV-03417-VC, 2025 WL 1752484, at *5 (N.D. Cal. June 25, 2025).
責任編輯:盧頎
【本文僅反映專家作者意見,不代表本報立場。】
|
















