Meta承认使用盗版数据集训练AI 但拒绝赔偿作家

2024-01-14 18:41:43 来源:游民星空 作者:猛鲨男鱼王 编辑:猛鲨男鱼王 浏览:loading

据外媒消息,Meta承认使用了“Books3”的盗版数据来训练其AI,然而该公司不愿意补偿作者。

不久前,一些作者对Meta提起了诉讼,声称其在开发其Llama 1和Llama 2大型语言模型中非法使用了受版权保护的材料。作为回应,Facebook回应了作家和喜剧演员莎拉·西尔弗曼、作家理查德·卡德瑞等领导法律行动的权利持有人,承认其LLM是使用受版权保护的书籍进行训练的。

游民星空

Books3是一个众所周知的数据集,包含超过195,000本书的纯文本集合,总计近37GB。该档案是由AI研究员肖恩·普瑞瑟在2020年创建的。

由于Books3数据集的广泛可用性,许多研究人员都在AI训练中广泛的使用它。包括Meta在内的大型科技公司已经利用了Books3和其他有争议的数据集用于其商业AI产品。基于这一原因,《纽约时报》已经起诉OpenAI和Microsoft。

游民星空

OpenAI公开宣称,在没有使用受版权保护的材料的情况下训练AI模型是“不可能的”,并认为法官和法院应该驳回权利持有人提起的赔偿诉讼。与此立场相呼应,Meta承认使用了Books3,但否认任何故意的不当行为。

Meta辩称其使用受版权保护的作品来训练LLM并不需要“同意、信用或补偿”。公司否认侵犯原告的“所谓”版权的指控,主张Books3中对受版权保护的作品的任何未经授权的复制都应被视为合理使用。

人喜欢
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏
Meta承认使用盗版数据集训练AI 但拒绝赔偿作家https://imgs.gamersky.com/upimg/new_preview/2024/01/14/origin_b_202401141841322851.jpg