《纽约时报》在当地时间4月6日的一篇报道中,详细介绍了一些AI公司在收集高质量数据训练大模型的办法。
报道中提到,OpenAI开发了Whisper音频转录模型来收集训练数据,转录了超过100万小时的YouTube视频来训练其大型语言模型GPT-4。
尽管OpenAI知道这一行为可能在法律上存在问题,但认为这是合理使用。近日,YouTube首席执行官Neal Mohan在采访中表示,虽然没有直接证据表明OpenAI采集YouTube视频来训练Sora,但他警告OpenAI的行为违反了YouTube现行的平台服务条款。
重度美颜后还是选择了粗大腿 透明内衣被夹度的囧图
老任妥协了?超英派遣中心部分激情床戏内容回归
剧透慎入!《生化危机9》偷跑剧情汇总来了
《老滚6》新爆料!陶德亲口确认新作搭载全新引擎
NS2独占新作翻车 外媒怒评:太平庸敷衍 不值70刀
赛博朋克"天花板"新作官宣第4次跳票!4.14首发XGP