使用真人配音員聲音進行AI訓練是否構成商標、著作權、形象權的侵害?2025年Lehrman v. Lovo, Inc.案

楊智傑/雲林科技大學 科技法律研究所 教授

0
19

有二位居住於美國紐約的聲音演員(下均稱配音員)控告人工智慧(AI)語音軟體開發商Lovo侵害他們的錄音與聲音,包括侵害美聯邦法的商標權、著作權、紐約州法的公開形象權等。2025年7月10日,紐約南區法院作成初步判決[1],認為未註冊商標權的主張不成立,著作權的主張部分有機會成立,而侵害紐約州的公開形象權則也很有可能成立。

圖片來源 : shutterstock、達志影像

Lovo招攬真人配音員打造AI語音生成訂閱服務,卻未告知實情

被告Lovo銷售一種「文字轉語音」(text-to-speech)的訂閱服務,使訂閱者能以低成本產生配音旁白。Lovo透過名為「Generator」或「Genny」的AI驅動軟體產製音檔,並宣稱此軟體係利用「數千個聲音」所創建。Genny具備製作聲音「複製」(clone)的功能,「意指虛擬仿造(copy)某一真實人物的聲音。與其使用機器學習合成為原創的AI聲音,聲音複製技術則是複製既有的人類聲音」[2]

原告Paul Lehrman與Linnea Sage皆為居住並工作於紐約的配音員。他們受雇朗讀腳本,製作錄音檔等,客戶再對他們提供的錄音檔進行剪輯、可能的修訂,並最終納入其他形式的媒體中[3]。Lovo最初係透過「Fiverr.com」這一自由工作者的線上平台招攬Lehrman與Sage參與錄音工作。Lovo員工未揭露他們身分,並用私人線上帳號聯繫Lehrman,聲稱僅會將錄音用於「研究用途」,且僅限於「內部」及「學術性質」的研究[4]。同樣地,Lovo員工亦對Sage說明:「這些是廣播廣告的測試朗讀稿。它們不會對外公開,只會作為內部使用,因此不需要徵求任何授權」[5]

Podcast節目揭穿Lovo意圖、真人配音員憤而群起提告

然而,當Lehrman與Sage在聆聽一集Podcast節目時,聽到自己的聲音被作為節目旁白,且Podcast文字說明節目旁白聲音係使用「Lovo的付費訂閱服務」AI所生成[6]。Lehrman與Sage才發現,Lovo在其文字轉語音的訂閱服務中,將Lehrman聲音複製並命名為「Kyle Snow」,而Sage的聲音則被命名為「Sally Coleman」。另外,Lovo更將Kyle Snow聲音納入其網站與YouTube的廣告中[7]。Lovo亦利用Sage原本提供的錄音與其「聲音複製版本」進行「並列比較」(side-by-side comparisons),作為其產品行銷的一環[8]

2023年Lehrman與Sage另代表其他配音員,對Lovo提起擬制集體訴訟,並提出多達16項的法律上侵權主張。Lovo則提出初步動議,請求直接駁回全部請求(motion to dismiss),毋庸進入陪審團審理[9]。以下僅挑選美《聯邦商標法》、美《著作權法》與紐約州公開形象權的部分加以介紹。

美《聯邦商標法》對未註冊商標之保護

Lehrman與Sag主張被告違反美聯邦商標法(Lanham Act)第43條(a)(1)(A)[10]。亦即認為自己的聲音是一種未註冊商標,而Lovo的使用,會讓消費者以為跟Lehrman與Sag有關聯,構成混淆誤認。雙方主要爭點在於,Lehrman與Sag是否指出一個受保護之標誌(mark)。各法院長期以來均認可與標誌類似的事物,例如名人的肖像、外在形象、人格或身分,可以成為受保護商標[11]法院認為,「聲音」也有機會獲得保護,但必須具有指示來源之意義[12]

法院指出,在名人代言案件中,「來源識別標誌」與其所識別之產品之區分並不明顯,因為名人的人格(persona)同時也是其產品。某種意義上,名人即是將其自身的身分商品化者[13]。然而,不同於名人代言案件,本案原告使用其聲音的方式,顯然可與其人格與身分分離[14]。其客戶支付報酬給原告,乃為取得其朗讀之錄音,是為了購買其具體的聲音特質,例如「音調、品質、音色及表達方式」[15]。由於Lehrman與Sag未能證明自己的聲音具有商標意義,故法院駁回原告就美《商標法》的侵權主張[16]

美《著作權法》

本案涉及之著作權標的為聲音錄音。Lehrman與Sag提出以下四種主張。

直接重製(Direct Reproduction

Lehrman與Sag主張,Lovo在2020年的簡報與其YouTube頻道影片中,重製了「Sage受著作權保護之實際錄音的一部分」。Lovo似乎亦承認,在2020年簡報中確實使用了部分Sage的錄音。此種使用明顯是為了推廣Lovo的產品與服務,不屬於Fiverr網站的服務條款授權範圍,構成直接侵權[17]

AI訓練(AI Training

Lehrman與Sage主張,Lovo使用其錄音訓練Genny AI模型,構成直接侵權。但法院認為,Lehrman與Sag在訴狀中僅反覆聲稱其聲音被「用於訓練Genny」,但未曾解釋何謂訓練、其運作方式為何。然而,法院允許原告可透過修正訴狀補正此缺陷[18]

AI輸出(AI Outputs

Lehrman與Sage主張,Genny模型所產生的輸出(即聲音複製品)構成著作權侵權。然而,在美國著作權法下,錄音著作擁有的專屬權利與一般著作不同,僅限於有限的行為類型,例如直接重製與剪接。但美《著作權法》第114條(b)特別強調,錄音的重製與衍生權,「不包括製作另一份全然獨立錄音之情況,即便該錄音之聲音模仿或模擬原錄音中的聲音」[19]

Lehrman與Sage僅主張Genny可模擬其聲音的屬性,如「音高、音量、音調、音色、語速、語調、氣聲、沙啞、緊張感、顫音、抖動、頻譜傾斜度及可理解性等」,並據此產生新錄音。而法院認為,著作權保護不及於此類「不完美模仿」,即便藉由先進科技完成。因此,Lehrman與Sage基於Genny輸出的著作權請求予以駁回[20]

幫助侵權(Contributory Infringement

Lehrman與Sage的幫助侵權請求,是指Lovo的輸出內容幫助使用者侵權。但如同上述,AI輸出本身不會侵害錄音著作,故針對幫助侵權的請求一樣不成立[21]

美《紐約州民權法》之公開形象權

美《紐約州民權法》(New York Civil Rights Law, NYCRL)第50條禁止「未事先取得當事人書面同意,而將任何在世者的姓名、肖像、照片、相貌或聲音,用於廣告目的或商業用途」[22]。2021年紐約州修改NYCRL第50-f條,並將第50條擴及於去世自然人(deceased natural person)的「數位仿造」(digital replica)。其定義為「由電腦生成之新創作、原創性的電子表演,呈現在一份另行新創、原創的表達性聲音錄音或視聽作品中;該表演並非當事人實際演出,但其逼真程度足以使一名理性觀察者相信,該表演乃由該被描繪之當事人而非任何其他人所演出。[23]

Lovo主張NYCRL第50-f條僅提到「去世者之數位仿造」,表示「在世者」即被排除於NYCRL第50條的適用範圍。然而,法院認為,在2021年修法之前,紐約法院在2018年的Lohan案已經認定:至少涉及視覺元素的在世者數位仿造,已涵蓋於該法保護範圍[24]。雖然Lohan案僅處理「肖像」問題,係針對視覺影像或虛擬替身(avatar),但其邏輯同樣適用於語音仿造。法院認為,該法保護的對象是「個人身分」,而非僅是其「姓名」、「肖像」或「照片」的財產利益。因此法院表示,「聲音」與「肖像」或「照片」一樣,都須受到數位仿造權的保護[25]

進而,Lehrman與Sage是否已充分主張關於:(1)可辨識性、(2)在紐約境內的行為、以及(3)用於廣告或商業目的等要件?法院認為,原告所提供證據顯然已足以證明其聲音之可辨識性。尤其,Lehrman與Sage提交了多份業界專業人士之聲明,指出語音仿造可辨識為原告之聲音[26]。原告除已充分主張其聲音仿造在紐約被使用,亦已充分主張其聲音仿造被用於廣告及商業目的。因此,法院駁回Lovo依據NYCRL第50條與第51條要求駁回的聲請[27]

結論

本判決目前只是初步判決,法院認為在著作權和紐約州法之公開形象權有機會成立,故本案仍可繼續往下走。但在此初步判決基礎上,雙方也很可能和解收場。

備註:

  1. [1] Lehrman v. Lovo, Inc., No. 24-CV-3770 (JPO), 2025 WL 1902547, at *22 (S.D.N.Y. July 10, 2025).
  2. [2] Id. at *1.
  3. [3] Id. at *1.
  4. [4] Id. at *2.
  5. [5] Id. at *2.
  6. [6] Id. at *2.
  7. [7] Id. at *3.
  8. [8] Id. at *3.
  9. [9] Id. at *1.
  10. [10] Id. at *7.
  11. [11] Id. at *7.
  12. [12] Id. at *8.
  13. [13] Id. at *9.
  14. [14] Id. at *10.
  15. [15] Id. at *10-11.
  16. [16] Id. at *13.
  17. [17] Id. at *18.
  18. [18] Id. at *18-19.
  19. [19] 17 U.S.C. § 114(b).
  20. [20] Lehrman v. Lovo, Inc., supra note 1, at *20.
  21. [21] Id. at *20.
  22. [22] Id. at *20.
  23. [23] NYCRL § 50-f.
  24. [24] Lohan v. Take-Two Interactive Software, Inc., 31 N.Y.3d 111, 117 (2018).
  25. [25] Lehrman v. Lovo, Inc., supra note 1, at *22.
  26. [26] Id. at *23.
  27. [27] Id. at *23-24.

責任編輯:盧頎

【本文僅反映專家作者意見,不代表本報立場。】

作者: 楊智傑
現任: 雲林科技大學科技法律所 教授
經歷: 真理大學法律系助理教授
真理大學法律系副教授
學歷: 台灣大學法律系
中央大學產業經濟所碩士
台灣大學法學博士
專長: 智慧財產權、美國專利法、美國著作權法、憲法

智權報388期文章列表

李淑蓮 從智財局2026預算看戰略:TIPO、USPTO、KIPO比一比
楊智傑 使用真人配音員聲音進行AI訓練是否構成商標、著作權、形象權的侵害?2025年Lehrman v. Lovo, Inc.案
李淑蓮 AI應用拉抬     先進封裝需求水漲船高
李淑蓮 人形機器人應用成熟落地     台灣廠商機會點為何?
吳碧娥 從AI資料中心發展趨勢看台灣產業機會
吳碧娥 解構美國《AI行動計劃》的指標意義
葉雪美 2025年歐盟設計新穎性優惠期範圍與適用定調 - 2:EUIPO無效部門駁回Case- T 6624無效申請案的決定
盧頎 40歲就是預防失智症黃金期 國衛院預告「台灣失智症風險因子管理白皮書」將發布
郭廷濠 糖尿病治療藥物西他列汀之先占及顯而易見性探討(下):Mylan Pharmaceuticals Inc. v. Merck Sharp & Dohme Corp. (Fed. Cir. 2022)
陳秉訓 以實例說明在地老店商標取得「著名性」的困境 建議認定範圍應從寬
邱英武 網路銷售侵害商標權時間點要注意
芮嘉瑋 AI機器人發展的隱形枷鎖:稀土依賴與地緣風險
吳碧娥 2025亞太永續博覽會:生物多樣性成企業變革重點

發表留言

請輸入您的評論!
請在此輸入您的姓名