法律資料涉及AI訓練資料庫之首件著作權侵權判決出爐:淺析Thomson Reuters v. Ross一案

許慈真/北美智權報 專欄作家

0
11

針對法律資料庫巨擘Thomson Reuters與競爭對手Ross Intelligence自2020年掀起之侵權爭議,德拉瓦州聯邦地院終於定調,Ross構成著作權侵害且不符合理使用。

圖片來源 : shutterstock、達志影像

本案[1]原告Thomson Reuters擁有知名法律研究平台Westlaw,為使用者提供判例法、州及聯邦法規、期刊論文、專論等法律資料。Thomson Reuters指控Ross Intelligence抄襲Westlaw資料庫提供之裁判要點(headnotes),Ross則質疑該資料庫中之要點及其法律分類系統「Key Number System」是否受法律保護,並主張合理使用。負責審理本案之Bibas法官曾於2023年裁決意見[2]中駁回兩造簡易判決之動議,卻在即將展開庭審之際,邀請兩造更新動議,並就涉訟要點中之2,243項(後稱系爭要點)認定構成侵權,同時駁回Ross合理使用之主張。惟Bibas法官亦指出,系爭要點中之個別著作權保護期間是否屆滿,屬於事實問題,應交由陪審團決定。

為瞭解第三方法律服務供應商LegalEase為Ross製作之Bulk Memo問答集,其中問題是否抄襲系爭要點,或僅是擷取自不受著作權保護之裁判意見?Bibas法官利用既有判決[3]作成以下之對照範例(非本案涉訟之資料),據此說明其裁決理由,分述如後。

Bulk Memo問題 Westlaw要點 裁判意見
Does originality for copyright purposes mean that the work was independently created and has some minimal degree of creativity? Originality, for copyright purposes, means that the work was independently created and has some minimal degree of creativity. Original, as the term is used in copyright, means only that the work was independently created by the author (as opposed to copied from other works), and that it possesses at least some minimal degree of creativity.

資料來源:引自本案判決Thomson Reuters Enter. Ctr. GmbH v. Ross Intel. Inc., Case No. 1:20-cv-613-SB (11 Feb 2025)

法院認定Ross構成直接侵權

系爭要點與Key Number System皆具原創性

於2023年意見中,Bibas法官曾以「要點與裁判意見間之字詞重疊程度」作為有無原創性(originality)之決定性因素,惟如今改認為,原創性門檻極低,僅需些許創造性火花即已足。Bibas法官表示,儘管裁判意見不受著作權保護,但編纂者透過精煉、綜合或解釋等方式,將冗長之裁判意見濃縮成簡短要點,係運用最低程度之創造力選擇及安排字詞而成,自然具備原創性,屬於事實性編輯著作,無論是「整體」或「個別」要點均受著作權保護。

同理,即使是逐字逐句引述部分裁判意見之要點(quote judicial opinions verbatim),亦是編纂者精心挑選之結果,其透過確定關鍵字詞、剔除雜亂內容等步驟,表達出其所認定之裁判重點。不過,Bibas法官補充道,這並不包括與裁判意見一字不差的要點(verbatim copies of the case opinion)。其次,著作是否受保護之關鍵在於有無原創性,與著作人投入努力多寡無關;且編輯著作不必「新穎」,只要是「著作人獨立創作」即可滿足原創性要件。因此,既然Key Number System是Thomson Reuters在眾多可行且合乎邏輯之法律主題分層架構法中所選定之方法,縱使該分類方法是法學院新生普遍知悉,亦不影響其原創性。

Ross實際抄襲系爭要點

證明實際抄襲(actual copying)之方式有二:一是直接證據;二是間接證據,證明被告曾接觸(access)原告著作並創作出類似作品,亦即存在近似性(probative similarity)。

兩造均同意,LegalEase確實取用Westlaw資料並以此製作Bulk Memo問答集,然而,僅是「接觸」不足以證明抄襲。Bibas法官逐一比對觀察Bulk Memo問題、系爭摘要以及裁判意見後,亦證實Bulk Memo問題與系爭摘要之近似程度高於其與裁判意見之近似程度,這已成為證明實際抄襲之有力旁證(circumstantial evidence) — 近似性加上接觸,即構成實際抄襲之證據。況且,如Ross法律顧問所言,Ross將Bulk Memo問題之80%用於初始訓練(initial training),20%用於驗證(validation),可說是將該問答集全數作為訓練AI之用。

Ross抄襲屬於不當挪用

倘若被告作品大致上(materially)挪用自原著作,即具備實質近似性(substantial similarity)[4]而構成不當挪用(improper appropriation)。實質近似性之判斷,係從產品之一般使用者(ordinary user)角度觀察,視被告作品是否與原著作實質近似而定;而所需之近似程度,則視著作之可受保護表達之範圍寬窄而定,如範圍越窄,涉嫌侵權之作品就必須與該著作越相似。因而,Bibas法官以自身立場為判斷(律師與法官皆是Westlaw平台之一般使用者),認定Bulk Memo問題與系爭要點明顯近似。

法院認定Ross不構成合理使用

利用之目的與特性

Ross之利用顯然屬於商業性,且該利用之目的或特性與Westlaw平台並無太大不同,故不具備轉化性(transformative)。Bibas法官特別指出,Ross並非採用可自行編纂新內容之生成式AI(Gen AI),而是利用系爭要點訓練AI,當使用者輸入法律問題時,會傳回事先備妥之相關裁判意見;此流程類似於Westlaw利用要點與Key Numbers來傳回符合要點之案件清單,而Thomson Reuters正是利用要點與Key Number System,協助法律研究人員瀏覽平台。

惟Ross對此抗辯,系爭要點並未出現在使用者接觸之最終產品中,其複製行為係發生在中間步驟(intermediate step),亦即,Ross將系爭要點轉換成描述法律詞彙彼此關係之數值型資料(numerical data)餵養給AI。就合理使用之第一項因素而言,在分析電腦程式之案件中,確實亦允許中間複製,例如Google[5]Sony[6]Sega[7]等皆是。

然而,本案看似與該等案件類似,實則不同。其差異點在於:(1)該等案件皆涉及電腦程式碼之複製,程式碼幾乎純屬功能性目的,與本案複製之要點等書面文字不同;(2)該等案件之複製係基於「抄襲對競爭對手創新而言乃是不可或缺」此一前提,惟本案欠缺此必要性。

Bibas法官表示,Ross之所以利用系爭要點,僅是為輕鬆開發出有競爭力之法律研究工具而已,此情況反倒較接近Warhol[8]所分析:抄襲並非達成新利用目的之合理必要手段。因此,本項因素判斷係有利於Thomson Reuters。

著作之本質

原則上,越具創意性之著作保護範圍越廣。儘管系爭要點符合原創性門檻,惟創意程度有限,故本項因素判斷係有利於Ross。

所利用之質量及其占整體著作之比例

在本案,本項因素之判斷關鍵在於「公眾接觸之質與量」(指是否成為競爭性替代商品),而非「被告抄襲之質與量」,鑑於Ross向使用者提供之內容並未包含系爭要點,故本項因素判斷係有利於Ross。

利用對於著作其潛在市場與現在價值之影響

原著作之市場為「法律研究平台」,以及著作人通常自行或授權他人開發之潛在衍生性市場,「法律AI工具之訓練資料」即是其一;於此前提下,Ross確實可能開發市場替代品以與Westlaw競爭,而非建立用途完全不同之新平台。況且,Ross並未舉證反駁此等潛在市場不存在、或不受影響,故本項因素判斷係有利於Thomson Reuters。

Bibas法官特別指出,本案情況與Google案不同,Sun Java API乃是程式設計師所熟悉慣用,Thomson Reuters所創作之要點或法律分類系統並無此特性,Ross大可自行創作或委託LegalEase為其創作,並無侵害Thomson Reuters著作權並主張合理使用之必要。

結語

儘管本案只是美國聯邦地院層級之司法裁判,且未涉及目前最熱門之Gen AI,但其後續審理結果以及法院見解之擴散效應,相當值得關注;更遑論,Bibas法官本身即為聯邦第三巡迴上訴法院之巡迴法官,其對於「中間複製」與「原著作潛在市場」之解釋及認定,確實可能影響Gen AI開發者主張合理使用之空間。上述案件分析亦可提供台灣政府針對各種資料庫進行AI訓練、Gen AI的運用相關立法參酌。

備註:

  1. [1] Thomson Reuters Enter. Ctr. GmbH v. Ross Intel. Inc., Case No. 1:20-cv-613-SB (11 Feb 2025).
  2. [2] Thomson Reuters Enter. Ctr. GmbH v. Ross Intel. Inc., 694 F. Supp. 3d 467 (D. Del. 2023).
  3. [3] Feist Publications, Inc. v. Rural Tel. Serv. Co., 499 U.S. 340, 345 (1991).
  4. [4] Bibas法官之論述類似於聯邦第二巡迴上訴法院之分析架構,因而區別出「probative similarity」與「substantial similarity」兩者。該兩者概念之差異可參閱下面兩篇文章:
    1. Henry J. Lanzalottie, Is Proof of Access Still Required – Proving Copyright Infringement Using the Strikingly Similar Doctrine: An Analysis of the Fourth Circuit’s Decision in Bouchat v. Baltimore Ravens, Inc., 9 Jeffrey S. Moorad Sports L.J. 97 (2002).
    2. 陳豐年、廖威智,《論著作權法之實質相似性(substantial similarity):以美國聯邦第二巡迴上訴法院判決為中心》,智慧財產權月刊第219期,2017年3月。
  5. [5] Google LLC v. Oracle Am., Inc., 593 U.S. 1, 24 (2021). 請參見北美智權報第286-287期介紹。
  6. [6] Sony Comput. Ent., Inc. v. Connectix Corp., 203 F.3d 596 (9th Cir. 2000).
  7. [7] Sega Enters. Ltd. v. Accolade, Inc., 977 F.2d 1510 (9th Cir. 1992).
  8. [8] Andy Warhol Found. for the Visual Arts, Inc. v. Goldsmith, 598 U.S. 508 (2023). 請參見北美智權報第345-346期介紹。

責任編輯:盧頎

【本文僅反映專家作者意見,不代表本報立場。】

作者: 許慈真
現任: 臺北大學土地與環境規劃研究中心研究員
學歷: 輔仁大學法律學系博士
輔仁大學財經法律翻譯碩士學程
輔仁大學財經法律學系碩士
輔仁大學法律學系學士
專長: 智慧財產權、法律翻譯

發表留言

請輸入您的評論!
請在此輸入您的姓名