陷入版权危机！OpenAI警告称这可能会摧毁ChatGPT

Hawk Insight

2024-01-08 14:50:14

3.25W

人工智能企业OpenAI近日陷入了版权纠纷，对此，OpenAI警告称，禁止使用新闻和书籍来训练聊天机器人将限制人工智能的发展。

OpenAI进一步表示，如果不依赖受版权保护的作品，就“不可能”创建出像ChatGPT的服务。

深陷版权纠纷

在2023年最后几天，著名新闻机构《纽约时报》（The New York Times）宣布起诉OpenAI及其背后最大的支持者微软。《纽约时报》声称，被告未经许可就使用起受版权保护的文章作为ChatGPT等AI聊天机器人背后大模型的训练素材。《纽约时报》要求OpenAI销毁任何使用其作品训练的系统。

OpenAI、NYT

《纽约时报》表示，此前其已经与OpenAI进行了数月的谈判，但未能达成一项关于付费许可内容的协议。

《纽约时报》并不是第一家就版权问题起诉OpenAI的机构，也不是最后一家。此外，还有一些个人作家、艺术家等也对OpenAI提起诉讼，指控OpenAI利用他们的作品来训练人工智能模型。

为了应对这些诉讼，OpenAI也在准备应对。

在提交的证据中，OpenAI表示：“因为今天的版权几乎涵盖了所有人类表达方式——包括博客文章、照片、论坛帖子、软件代码片段和政府文件——因此不可能在不使用受版权保护材料的情况下，训练出当今领先的人工智能模型。”

“将训练数据限制在一个多世纪前创作的公共领域书籍和绘画上，可能会产生一个有趣的实验，但不会提供满足当今公民需求的人工智能系统。”

版权监管的两难抉择

这些创作者纷纷要求政府加强对AI版权监管。不过迄今为止，法官似乎还是站在了科技公司这边。

科技公司在法庭上为自己的人工智能训练进行了辩护，将其与人类学习新概念的方式进行了比较，并认为他们对材料的使用符合版权法下的“合理使用”。在法庭上，Meta辩解道：“就像孩子通过听日常演讲、睡前故事、收音机里的歌曲等来学习语言（单词、语法、句法、句子结构）一样，模型通过训练接触大量文本来‘学习’语言。”

人工智能支持者认为，此类版权诉讼中，一旦有对人工智能公司不利的裁决，对该行业来说将是灾难性的。

硅谷风险投资公司Andreessen Horowitz表示：“将实际或潜在的版权责任成本强加给人工智能模型的创建者，要么会扼杀或严重阻碍其发展。”

而作家贸易组织作家协会告诉版权机构：“授权受版权保护的材料来培训LLM可能会很昂贵，但事实上，任何LLM的价值中很大一部分都应该归功于（创作者）专业创作出来的材料。”