曾被誉为“AI教母”的李飞飞所创办的World Labs公司,近日在社交平台X上正式发布实时帧模型RTFM(Real-Time Frame Model),实现在单块英伟达H100 GPU上同步完成高保真3D世界渲染与用户实时交互,引发业界广泛关注。
传统世界模型的发展长期受限于庞大的算力需求。World Labs指出,当前生成式世界模型的计算复杂度远超大型语言模型。
以生成60帧/秒的4K交互视频为例,每秒需处理超过10万个token,若持续运行一小时,上下文管理规模将突破1亿token。
作为对比,OpenAI的Sora虽具备一定世界建模能力,但据Factorial基金会的估算,其峰值运行需依托72万块H伟达H100 GPU组成的集群。