
随着人工智能(AI)技术的快速发展,版权相关法令面临前所未有的冲击。新加坡将AI发展列为国家重点政策,并于2021年在其国家的《版权法》中增订(1)计算机数据分析(computational data analysis, CDA)例外及(2)将《合理处理条款》进行调整;试图在促进AI创新与保护版权之间取得平衡。然而,就在一年后,大型语言模型(LLMs) — ChatGPT横空出世,CDA例外能否因应LLMs与生成式人工智能(Gen AI)到目前为止所带来的挑战?本文将探讨此一问题。
什么是CDA?
2021年修正的新加坡《版权法》第243条规定,CDA包括:(1)使用计算机程序从著作或录制物中识别、提取及分析信息或数据;以及(2)使用著作或录制物作为某类信息或数据的范例,以改善计算机程序在处理该类信息或数据方面的功能,例如使用图像来训练计算机程序以辨识图像[1]。新加坡知识产权局(IPOS)进一步说明,CDA包括「情感分析、文本与数据探勘,以及机器学习训练」[2]。
CDA例外之要件
CDA例外允许利用人重制受版权保护的著作,为维护版权人利益,必须符合下列要件:
- 该重制物系为计算机数据分析目的而制作,或为计算机数据分析而准备[3];
- 使用者不得与他人分享著作重制物,但为验证计算数据分析结果或为与该分析目的相关协同研究或研习者,不在此限[4];
- 使用者不得将依此例外规定所制作之著作重制物用于任何其他目[5];
- 使用者必须合法取得(lawful access)欲重制著作。依本条例示,若X系透过规避付费墙而取得第一份重制物,则X并非合法取得该重制物。若X系违反数据库使用条款而取得第一份重制物,则X并未合法取得该重制物[6]。值得注意的是,依新加坡《版权法》第187条(1)之规定,任何契约条款若直接或间接意图排除或限制CDA规定下的任何允许使用,该契约条款在此范围内无效[7]。其目的在于,藉以避免版权人透过私法契约架空CDA例外。
- 作为重制来源著作本身不得为侵权重制物,除非该侵权重制物对于该特定分析而言系属必要;或者,若其为侵权重制物,使用者必须不知此情事。但若该侵权重制物系取得自众所周知的侵权网站(如LibGen等影子图书馆[8]),使用者必须不知或无合理可能知悉此情事,才得主张CDA例外[9]。
根据IPOS提供的例示,一家公司正在开发能将书籍从一种语言翻译成另一种语言的AI程序。为训练该程序辨识模式,公司需要重制各种书籍。该公司可依CDA例外进行重制,无须事先取得版权人许可,但必须遵守相关条件:「不得将重制物用于数据分析以外目的,且必须合法取得数据,例如购买书籍或订阅相关服务,不得规避付费墙取得书籍[10]」。
新加坡《版权法》修法重点 — 增订CDA例外与合理使用条款适用
CDA例外
新加坡CDA例外制定于2021年,当时立法者所预期的AI应用主要为传统机器学习,其核心在于「分析数据模式」,而非利用表达内容。然而,随着 — ChatGPT于2022年11月发布,相关版权议题的重心随之转向LLMs与Gen AI。CDA例外能否适用于上述两者议题,成为亟待厘清的问题。
首先,就输入 / 训练阶段而言,Gen AI制作重制物(包括将著作转换为机器可读格式,或在某些Gen AI中储存数据)并非仅为了分析数据以改善AI针对该数据的运作功能,而是为了根据这些资料生成新的表达性作品,此一目的已超出CDA例外所允许的范围。另外,LLMs在训练过程中,从网络抓取文字及图像往往会绕过付费机制或违反使用条款,从而违反合法取得要件。据称ChatGPT及其前身LLMs使用来自Common Crawl、BookCorpus、Books1及Books2等影子图书馆的数据集进行训练,此一事实显示其数据取得方式并不合法[11]。
其次,就输出 / 生成阶段而言,新加坡《版权法》第243条对CDA的定义并未涵盖基于分析数据而生成或散布新著作行为。因此,CDA例外的适用范围仅涵盖输入阶段(即为训练目的而重制著作之行为),对于输出阶段(即AI系统生成新内容之行为)则不提供任何保护。当Gen AI生成的内容产生版权争议时,必须回归传统《版权法》的框架进行判断。具体而言,须就个别AI生成内容进行实质近似性分析,判断是否构成对特定著作之侵权;若构成侵权,则可能进一步审酌积极抗辩是否成立,包括依据新加坡《版权法》第191条进行合理使用分析[12]。
合理使用条款
新加坡于2021年《版权法》修法时,改采美国式的合理使用(fair use)条款,取代原本英国式的合理处理(fair dealing)条款。新加坡《版权法》第190条明定对著作进行合理使用系属允许之使用。与上同法第191条则规定,在判断著作是否构成合理使用时,必须考虑所有相关事项,包括下列四项因素:(1)使用之目的及性质,包括该使用是否具商业性质或系为非营利教育目的;(2)著作之性质;(3)所使用部分之数量及实质性占整体著作之比例;以及(4)该使用对著作潜在市场或价值所产生之影响。
不同于先前的《合理处理条款》,《合理使用条款》作为一种开放性的一般例外规定,允许法院依个案情况灵活适用,透过权衡上述四项非排他性因素,判断未经授权的使用是否合理而得以允许。根据新加坡政府的说明,此一从「合理处理」转向「合理使用」的立法变革,旨在使《版权法》更具前瞻性与弹性,俾能在版权利人与公众利益之间取得更适当的平衡[13]。
由于CDA例外显然无法跟上AI科技发展的脚步,学者讨论Gen AI版权争议的重心已转向《合理使用条款》的适用。尽管至今尚无相关判例,但一般认为新加坡法院将会追随美国法院的见解。因此,在Gen AI应用的合理使用分析中,可能占有最大权重的两项因素为:(1)使用目的或性质,包括Gen AI的使用是否具有「转化性」,即在某种程度上改变了原著作的目的或性质;以及(2)Gen AI的使用对市场的影响,亦即其是否透过与原著作或其授权市场竞争,而威胁原创作者的生计[14]。
综上所述,面对LLMs及Gen AI带来的新兴挑战,CDA例外在AI输入与输出阶段皆面临适用上的困境,而开放性的《合理使用条款》似乎则提供了更具弹性的法律架构。
结论
新加坡2021年《版权法》引入CDA例外,旨在创造有利AI发展的法律环境。然而截至2025年回顾看来,面对LLMs、Gen AI的快速发展,仅透过CDA例外已难以因应Gen AI带来的挑战。相较之下,同时引进的《合理使用条款》,透过转化性判断与市场影响评估等弹性因素,似乎更适合在AI创新与版权保护之间寻求适当平衡。新加坡的CDA例外未来是否仍具存在价值?以及如何与《合理使用条款》互动,仍有待未来观察新加坡当局是否针对上述状况进一步对《版权法》进行修法调整。
备注:
- [1] Singapore Copyright Act 2021 s. 243.
- [2] IPOS (24 November 2022) Factsheet on Copyright Act 2021, https://ipr.mofcom.gov.cn/hwwq_2/zn/Asia/Sgp/file/copyright-act-factsheet.pdf.
- [3] Singapore Copyright Act 2021 s. 244(2)(a).
- [4] Singapore Copyright Act 2021 s. 244(2)(c).
- [5] Singapore Copyright Act 2021 s. 244(2)(b).
- [6] Singapore Copyright Act 2021s. 244(2)(d).
- [7] Singapore Copyright Act 2021 s. 187(1).
- [8] 影子图书馆(shadow libraries)多以侵犯著作权的方式向人们提供学术文献及小说著作等内容,并多以去中心化、匿名见称,较大型的影子图书馆包括创世纪图书馆、Z-Library、Sci-Hub等;参考来源:维基百科。
- [9] Singapore Copyright Act (021 s. 244(2)(e).
- [10] IPOS (24 November 2022) Factsheet on Copyright Act 2021, https://ipr.mofcom.gov.cn/hwwq_2/zn/Asia/Sgp/file/copyright-act-factsheet.pdf.
- [11] David Tan, Generative AI and Copyright, March 2024, https://law.nus.edu.sg/trail/generative-ai-copyright-fair-use/.
- [12] Id.
- [13] David Tan, Copyright Fair Use in the Face of Technological Developments: Staying Ahead or Limping Behind? (Part I), November 2024, https://lawgazette.com.sg/feature/copyright-fair-use-part-1/.
- [14] David Tan, Generative AI and Copyright, March 2024, https://law.nus.edu.sg/trail/generative-ai-copyright-fair-use/.
责任编辑:卢颀
【本文仅反映专家作者意见,不代表本报立场。】
|
















