陷入版权危机!OpenAI警告称这可能会摧毁ChatGPT
人工智能企业OpenAI近日陷入了版权纠纷,对此,OpenAI警告称,禁止使用新闻和书籍来训练聊天机器人将限制人工智能的发展。
人工智能企业OpenAI近日陷入了版权纠纷,对此,OpenAI警告称,禁止使用新闻和书籍来训练聊天机器人将限制人工智能的发展。
OpenAI进一步表示,如果不依赖受版权保护的作品,就“不可能”创建出像ChatGPT的服务。
深陷版权纠纷
在2023年最后几天,著名新闻机构《纽约时报》(The New York Times)宣布起诉OpenAI及其背后最大的支持者微软。《纽约时报》声称,被告未经许可就使用起受版权保护的文章作为ChatGPT等AI聊天机器人背后大模型的训练素材。《纽约时报》要求OpenAI销毁任何使用其作品训练的系统。
《纽约时报》表示,此前其已经与OpenAI进行了数月的谈判,但未能达成一项关于付费许可内容的协议。
《纽约时报》并不是第一家就版权问题起诉OpenAI的机构,也不是最后一家。此外,还有一些个人作家、艺术家等也对OpenAI提起诉讼,指控OpenAI利用他们的作品来训练人工智能模型。
为了应对这些诉讼,OpenAI也在准备应对。
在提交的证据中,OpenAI表示:“因为今天的版权几乎涵盖了所有人类表达方式——包括博客文章、照片、论坛帖子、软件代码片段和政府文件——因此不可能在不使用受版权保护材料的情况下,训练出当今领先的人工智能模型。”
“将训练数据限制在一个多世纪前创作的公共领域书籍和绘画上,可能会产生一个有趣的实验,但不会提供满足当今公民需求的人工智能系统。”
版权监管的两难抉择
除了OpenAI,其他正在训练模型的大型科技公司也都遇到了相同的问题。不少版权所有者认为,科技公司在未经许可的情况下获取和复制其材料用于人工智能培训,从而侵犯了他们的版权。他们要求科技公司进行赔偿,并希望法院下令阻止滥用其作品。
这些创作者纷纷要求政府加强对AI版权监管。
去年在一起涉及Meta旗下大模型Llama侵权案件中,美国地区法官Vince Chhabria在去年11月的听证会上表示,他将批准Meta的动议,驳回创作者关于Llama生成的文本侵犯其版权的指控。Chhabria说:“当我询问Llama时,我并不是要一本书,我甚至没有要求摘录。”Chhabria的看法是不少法官想法的缩影,他们对版权所有者基于人工智能生成的内容提出的侵权主张表示怀疑。
科技公司在法庭上为自己的人工智能训练进行了辩护,将其与人类学习新概念的方式进行了比较,并认为他们对材料的使用符合版权法下的“合理使用”。在法庭上,Meta辩解道:“就像孩子通过听日常演讲、睡前故事、收音机里的歌曲等来学习语言(单词、语法、句法、句子结构)一样,模型通过训练接触大量文本来‘学习’语言。”
人工智能支持者认为,此类版权诉讼中,一旦有对人工智能公司不利的裁决,对该行业来说将是灾难性的。
硅谷风险投资公司Andreessen Horowitz表示:“将实际或潜在的版权责任成本强加给人工智能模型的创建者,要么会扼杀或严重阻碍其发展。”
而作家贸易组织作家协会告诉版权机构:“授权受版权保护的材料来培训LLM可能会很昂贵,但事实上,任何LLM的价值中很大一部分都应该归功于(创作者)专业创作出来的材料。”
法律跟不上AI的步伐
OpenAI在面对《纽约时报》的诉讼时表示,其在训练模型时遵守所有版权法。其认为“从法律上讲,版权法并不禁止训练”。
政府部门曾提议更新版权法,豁免文本和数据挖掘,以吸引人工智能开发者,但在去年遭到创作者的强烈反对后,他们放弃了这一计划。
此外,政府部门曾试图在科技公司和创作者之间促成自愿协议,但谈判一直很困难,政府最近承认可能必须立法才能打破僵局。
据悉,美国相关部门正在考虑针对版权和人工智能的新法律,以将这一现存的“灰色地带”清晰化。
据了解,目前OpenAI已与美联社、德国媒体巨头Axel Springer(旗下拥有Politico和Business Insider等)数家出版商达成协议,以获得其内容的访问权。
报道称,在与OpenAI签署协议后,Axel Springer有望在未来三年从提供给OpenAI的数据机材料中赚取数千万欧元。
OpenAI还表示,其正在寻求与出版商达成更多协议,同时还计划开发工具,允许版权所有者可以选择不使用他们的作品来训练人工智能系统。
·原创文章
免责声明:本文观点来自原作者,不代表Hawk Insight的观点和立场。文章内容仅供参考、交流、学习,不构成投资建议。如涉及版权问题,请联系我们删除。