吉卜力效应:OpenAI图像生成器点燃版权风暴

数字世界的变化日新月异,这一点在人工智能领域表现得尤为明显。就在 OpenAI 将其最新的图像生成能力集成到 ChatGPT 中并发布后仅一天,社交媒体平台便成了展示一种奇特却又立即可辨认的艺术潮流的画布:以 Studio Ghibli 独特的、充满奇思妙想的风格渲染的 meme 和图像。这家备受喜爱的日本动画工作室,曾创作出《龙猫》(My Neighbor Totoro) 和奥斯卡获奖影片《千与千寻》(Spirited Away) 等电影瑰宝,其独特的美学风格突然被无休止地复制,应用于从科技亿万富翁到奇幻史诗的各种事物上。

这种现象并非潜移默化。信息流中充斥着对当代人物和虚构宇宙的 Ghibli 式解读。我们看到 Elon Musk 被重新想象成一个可能漫步在神秘森林中的角色,《指环王》(The Lord of the Rings) 的场景被赋予了柔和、富有绘画感的动漫触感,甚至美国前总统 Donald Trump 也通过这种特定的艺术镜头被描绘出来。这一趋势获得了如此大的关注,以至于 OpenAI 自己的 CEO Sam Altman 似乎也用了一张 Ghibli 风格的肖像作为他的个人资料图片,这张图片很可能就是由引发讨论的工具本身生成的。其机制似乎很简单:用户将现有图像输入 ChatGPT,提示 AI 以标志性的 Ghibli 风格重新诠释它们。这种风格模仿的爆炸式增长,在引发病毒式娱乐的同时,也立即重新引发了人们对人工智能和知识产权的深层焦虑。

病毒式火花及其回响

这并非新的 AI 功能首次引发与图像处理和版权相关的涟漪。OpenAI 的 GPT-4o 更新实现了这种风格转换,而就在此之前不久,Google 在其 Gemini Flash 模型中引入了类似的 AI 图像功能。那次发布在三月初也曾因不同原因引发过病毒式关注:用户发现它能熟练地去除图像水印,这种做法直接挑战了摄影师和艺术家对其作品的控制权。

像 OpenAI 和 Google 这样的科技巨头的这些发展,标志着 AI 驱动内容创作的可访问性和能力实现了显著飞跃。曾经需要专业软件和相当艺术技巧才能完成的事情——复制一种复杂的视觉风格——现在只需一个简单的文本提示就能近似实现。输入“in the style of Studio Ghibli”(以 Studio Ghibli 的风格),AI 就会照做。虽然用户对这种新颖性和创造潜力感到欣喜,但这种复制的便捷性却将一个困扰 AI 行业的基本问题置于聚光灯下:这些强大的模型是如何被训练以实现这种模仿的? 问题的症结在于这些系统所吸收的数据。像 OpenAI 这样的公司是否在未经许可或补偿的情况下,将包括 Studio Ghibli 电影帧在内的大量受版权保护的材料输入其算法?以及至关重要的是,这种训练是否构成版权侵权?

表面之下:版权难题

这个问题不仅仅是学术性的;它构成了目前针对生成式 AI 模型开发者展开的众多高风险法律战的基础。围绕 AI 训练数据的法律环境,委婉地说,是模糊不清的。Neal & McDevitt 律师事务所的知识产权律师 Evan Brown 将当前状况描述为在一个显著的“法律灰色地带”中运作。

一个关键的复杂点在于,艺术风格本身通常不受版权法保护。版权保护的是思想的具体表达——完成的画作、写成的小说、录制的歌曲、实际的电影帧——而不是构成“风格”的基础技术、情绪或特征性视觉元素。因此,Brown 指出,OpenAI 仅仅通过生成看起来像是 Studio Ghibli 出品的图像,可能并未违反法律条文。生成某种风格的图像的行为,其本身并不构成对风格本身的版权侵权。

然而,分析不能止步于此。正如 Brown 强调的,关键问题在于 AI 学习复制该风格的过程。专家们认为,要实现如此准确的风格模拟,AI 模型极有可能需要在包含海量数据集(可能包括数百万张受版权保护的图像,甚至直接来自 Ghibli 电影库的帧)上进行训练。将这些作品复制到训练数据库中的行为,即使是为了“学习”的目的,本身也可能被视为侵权,无论最终输出是否是任何单一帧的直接复制品。

“这确实让我们回到了过去几年一直在酝酿的基本问题,”Brown 在一次采访中表示。“这些系统出去抓取网络,并将大量可能受版权保护的内容吸收到它们的训练数据库中,这会产生什么样的版权侵权影响?” 核心的法律挑战在于确定这个对于 AI 功能至关重要的初始复制阶段,在现有版权框架下是否被允许。

合理使用的钢丝绳

AI 公司在这种情况下经常援引的主要辩护理由是合理使用 (fair use) 原则。合理使用是美国版权法中一个复杂的法律原则,允许在特定情况下未经权利人许可有限度地使用受版权保护的材料。法院通常分析四个因素来确定特定使用是否符合合理使用的条件:

  1. 使用的目的和性质: 使用是否具有变革性(增加了新的含义或信息)?是商业性的还是非营利/教育性的?AI 公司辩称训练模型是变革性的,因为 AI 学习模式而非仅仅存储副本,最终目标是创造新作品。批评者则认为这种使用具有高度商业性,并常常与原作市场直接竞争。
  2. 受版权保护作品的性质: 使用事实性作品通常比使用高度创造性的作品更有利。在电影或小说等艺术作品上进行训练可能会对合理使用不利。Studio Ghibli 的电影具有高度原创性和创造性,属于后者。
  3. 使用部分的数量和实质性: 复制了原作的多少?虽然 AI 可能不会复制整部电影,但训练可能涉及复制大量的帧或图像。即使没有任何单一输出复制了 Ghibli 作品的大部分内容,复制数百万帧是否构成使用了 Ghibli 全部作品的“实质性”部分?这仍然是一个有争议的点。
  4. 使用对受版权保护作品潜在市场或价值的影响: AI 生成的内容是否取代了原作或授权衍生品的市场?如果用户可以按需生成 Ghibli 风格的图像,这是否会降低官方 Ghibli 艺术品、商品或授权机会的价值?创作者们强烈认为确实如此。

目前,多家法院正在努力解决在受版权保护的数据上训练大型语言模型 (LLMs) 和图像生成器是否构成合理使用的问题。目前还没有专门针对这种现代技术背景的明确法律先例,使得案件结果高度不确定。这些案件的判决将对 AI 发展和创意产业的未来产生深远影响。

OpenAI 的钢丝绳:政策与实践

在应对这片不确定的法律领域时,OpenAI 试图划定界限,尽管这些界限在仔细审视下显得有些模糊。根据 OpenAI 发言人向 TechCrunch 提供的一份声明,该公司的政策规定 ChatGPT 应拒绝复制“在世个体艺术家风格”的请求。然而,同一政策明确允许复制“更广泛的工作室风格”。

这种区分立即引发了疑问。如果不是该工作室相关主要艺术家的集体愿景和执行,什么构成了“更广泛的工作室风格”?就 Studio Ghibli 而言,该工作室的美学与其联合创始人兼主要导演Hayao Miyazaki(一位健在的艺术家)的愿景密不可分。人们真的能将“Ghibli 风格”与 Miyazaki 标志性的导演风格、角色设计和主题关切分离开吗?这项政策似乎依赖于一种可能站不住脚的人为区分,尤其是当工作室的身份与特定的、可识别的创作者如此紧密地联系在一起时。

此外,Ghibli 现象并非孤立事件。用户已经轻易地证明了 GPT-4o 的图像生成器能够模仿其他可识别的风格。有报道称,有人创作了具有 Dr. Seuss(Theodor Geisel,已故,但其遗产管理机构极力保护其独特风格)鲜明风格的肖像,以及将个人照片以 Pixar Animation Studios 特有的外观和感觉重新构想。这表明风格模仿的能力是广泛的,而“在世艺术家”和“工作室风格”之间的政策区分,可能更多的是一种反应性措施,而非技术上稳健或伦理上一致的界限。对各种 AI 图像生成器的测试证实了这一观察:虽然像 Google 的 Gemini、xAI 的 Grok 和 Playground.ai 等其他工具可以尝试风格模拟,但 OpenAI 的最新版本似乎在捕捉 Studio Ghibli 美学细微差别方面尤为出色,使其成为当前争议的焦点。

酝酿中的风暴:诉讼格局

病毒式传播的 Ghibli 图像生动地说明了已在进行中的重大法律战的核心问题。几起引人注目的诉讼将创作者和出版商与 AI 开发者对立起来,挑战他们训练实践的合法性。

  • The New York Times 和其他出版商 vs. OpenAI: 这起里程碑式的案件指控 OpenAI 在未经许可、署名或付费的情况下,使用数百万篇受版权保护的新闻文章训练其模型(包括 ChatGPT),从而进行了大规模版权侵权。出版商认为这破坏了他们的商业模式,并构成不正当竞争。
  • Authors Guild 和个体作者 vs. OpenAI 和 Microsoft: 作者们也提出了类似的诉讼,声称他们的书籍被非法复制用于训练大型语言模型。
  • 艺术家 vs. Stability AI, Midjourney, DeviantArt: 视觉艺术家们已对 AI 图像生成公司提起集体诉讼,认为他们的作品在未经同意的情况下被从互联网上抓取并用于训练,使得 AI 能够生成与他们直接竞争的作品。
  • Getty Images vs. Stability AI: 这家图片库巨头正在起诉 Stability AI,指控其涉嫌复制数百万张图片(在某些情况下甚至带有水印)来训练 Stable Diffusion 模型。

这些诉讼共同主张,未经授权将受版权保护的材料用于训练 AI 模型,侵犯了版权所有者复制、分发和创作衍生作品的专有权。他们不仅寻求金钱赔偿,还可能寻求禁令,迫使 AI 公司使用经过适当许可的数据重新训练其模型——这将是一项极其昂贵和耗时的任务,可能削弱其当前的能力。被告方则主要依赖合理使用论点,并声称他们的技术促进了创新并创造了新的表达形式。

技术军备竞赛 vs. 法律清算

尽管面临迫在眉睫的法律威胁和明显的伦理困境,AI 发展的步伐丝毫没有放缓的迹象。像 OpenAI 和 Google 这样的公司正陷入激烈的竞争战,不断推出新功能和模型以抢占市场份额并展示技术优势。能够进行复杂风格模仿的先进图像生成工具的快速部署,似乎是为了吸引用户和展示进展,即使其法律基础仍然不稳固。

OpenAI 的新图像工具需求如此之高,以至于不得不推迟向免费用户推出,这一事实突显了公众对这些功能的好奇心和参与热情。对于 AI 公司而言,用户参与度和展示尖端功能目前可能比潜在的法律风险更重要,或者这是一种有计划的赌博,赌法律最终会向他们有利的方向调整,或者可以达成和解。

这种情况凸显了技术能力的指数级加速与法律和伦理框架更为审慎、有节制的步伐之间日益加剧的紧张关系。法律往往滞后于技术,而生成式 AI 提出了一个尤为复杂的挑战,迫使社会在数字时代重新思考关于作者身份、创造力和知识产权的长期观念。

回响与先例

历史上不乏突破性技术颠覆既定版权规范的先例。复印机的出现引发了对未经授权复制的担忧。自动演奏钢琴挑战了音乐表演权的定义。录像机 (VCR) 引发了里程碑式的“Betamax 案”(Sony Corp. of America v. Universal City Studios, Inc.),美国最高法院在该案中裁定,录制电视节目供日后观看(“时间平移”)构成合理使用,部分原因是该技术具有大量的非侵权用途。后来,像 Napster 这样的数字音乐共享平台引发了另一波关于在线分发和版权侵权的法律战,最终催生了像 iTunes 和流媒体服务这样的新许可模式。

虽然这些历史案例提供了背景,但生成式 AI 的规模和性质带来了独特的挑战。与主要实现个人复制的 VCR 不同,生成式 AI 基于从可能海量的受版权保护输入中学习到的模式来创造内容,这引发了关于变革性和市场损害的不同问题。法院是否会认为 AI 训练类似于时间平移,还是更类似于 Napster 所助长的大规模侵权,仍有待观察。

未写的未来

当前围绕 AI 生成的 Ghibli 风格图像的狂热,不仅仅是一种短暂的互联网趋势;它是一个更大、持续进行的斗争的症状,旨在界定人工智能时代知识产权的边界。悬而未决的诉讼结果、潜在的立法行动以及行业实践(如训练数据的许可协议)的演变,将塑造未来几年 AI 发展及其对创意行业影响的轨迹。

法院会裁定在受版权保护的数据上进行训练需要明确许可和授权,从而可能迫使现有 AI 模型进行代价高昂的重组吗?还是会认定这种训练属于合理使用,为持续快速发展铺平道路,但可能贬低人类创作内容的价值?是否会出现一种中间地带,涉及新的强制许可计划或行业范围的协议?

答案仍然难以捉摸。显而易见的是,AI 现在能够轻易模仿独特艺术风格,这迫使我们直面关于创造力、所有权以及我们赋予人类表达的价值等基本问题。充斥互联网的异想天开的 Ghibli meme,仅仅是一个深刻而复杂的法律和伦理冰山那迷人且易于理解的表面,其全貌才刚刚开始显现。这些问题的解决不仅将决定 AI 的未来,也将决定未来几十年艺术家、作家、音乐家和各类创作者的生存环境。