财联社5月1日讯(编辑 牛占林)美东时间周二,美国八家新闻机构在纽约联邦***对OpenAI、微软提***讼,指控这两家公司在未经许可的情况下,使用了它们的新闻作品来训练生成式人工智能(AI)。
据悉,这八家新闻机构分别为《纽约每日新闻》、《芝加哥论坛报》、《奥兰多哨兵报》、《水星报》、《丹佛邮报》、《先锋新闻》等,它们均属于一家叫做奥尔登全球资本公司的对冲基金。
这些新闻机构当天指控称,微软的Copilot和OpenAI的ChatGPT非法***了数百万篇文章来培训AI模型。
诉状还提到,某些时候微软和OpenAI的AI会逐字或近乎逐字地***受版权保护的新闻作品,但不提供这些作品的作者、标题、版权或使用条款信息。更可恶的是,ChatGPT还“伪造”了那些损害其声誉的文章,比如《丹佛邮报》一篇宣扬吸烟可以治疗哮喘的虚***文章。
这些新闻机构要求OpenAI和微软赔偿它们的损失,并停止进一步侵犯版权行为。
OpenAI发言人周二表示,该公司在产品开发和设计过程中非常注重支持新闻机构。“尽管我们之前没有意识到奥尔登公司的担忧,但我们正在积极与世界各地的许多新闻机构建立建设性的合作伙伴关系和进行对话,以探索机会,讨论任何问题,并提供解决方案。”
在此之前,《***》和另外三家新闻机构The Intercept、Raw Story和AlterNet也对微软和OpenAI发起了类似的诉讼。
新闻行业的律师Steven Lieberman评论称,OpenAI的巨大成功也要归功于其他人的工作,它在未经许可或付款的情况下获取了大量优质内容。
《***》本月揭露称,OpenAI、谷歌、Meta等公司为了获取训练语料,不惜修改政策条款、无视互联网信息的使用规则,违法使用了“多个来源”的数据。
这一切的背后是,训练大语言模型用的数据越多,表现就会越好,但现在科技公司使用数据的速度已经超过数据生产的速度,甚至已经耗尽了互联网上所有可靠的英文文本***。
版权合作
与此同时,科技公司也在与新闻机构达成合作协议。就在本周,英国《金融时报》(FT)宣布与OpenAI达成协议,将授权后者使用其资料库来训练AI模型。
今年1月,OpenAI表示,其正与数十家出版商洽谈文章授权协议。截至目前,除了FT外,OpenAI还和美国的美联社、德国的施普林格、法国的《世界报》和西班牙的Prisa Media达成了协议。