AI驱动的工具和应用程序所生成的内容无疑令人印象深刻,但这些人工智能公司从哪里获取数据来训练这些模型呢。
404 Media的一份报道指出, AI视频生成公司Runway在未获得创作者或YouTube许可的情况下,使用大量视频训练了其Gen-3 Alpha模型,还使用盗版内容来训练AI模型。他们收到了一份电子表格,其中列出了视频的来源以及数量,这些视频来自各大新闻媒体以及频道,总数超10万个。
一位不愿透露姓名的前员工告诉404 Media:“该电子表格中的频道是全公司范围为寻找高质量视频用于训练模型而做出的努力。之后,这些视频会被爬虫下载下来,还使用了代理以免被谷歌阻止。”
穿上小姐姐最贵的衣服 透漏点劲爆剧情的囧图
一小时看个够!《宝可梦》新作超长实机发布
嘲讽政治正确的游戏被Steam禁售!作者愤而免费发放
特别好评武侠新作来了!官方发布首曝PV
大雷《白雪公主》游戏新实机:白色束腰超绝美背
国区好评仅53%!哥布林新作这波翻车太狠了