前不久国产GPU初创企业摩尔线程上市,市值一度达到了4000多亿元,今天该公司又发布了新一代GPU架构,AI及游戏性能大涨,其中游戏性能飙升了15倍。
即便是当前一代的显卡中,摩尔线程也在不断联合伙伴优化,硅基流动今天宣布在S5000显卡上实现了国产GPU推理性能的飞跃。
根据他们的实测数据,经过系统级工程优化与FP8精度加速,摩尔线程MTT S5000单卡Prefill吞吐达到4000 tokens/s 以上,Decode吞吐超过1000 tokens/s。
这是什么概念,他们对比了NVIDIA的H100显卡,Prefill 阶段同场景下H100性能约为6500 tokens/s,在MTT S5000上实现了4000+ tokens/s 的实测吞吐,达成了NVIDIA H100逾61%的实测性能。
虽然也只是Prefill阶段的性能,但是S5000能有H100显卡60%以上的性能绝对是国产显卡中的一大进步。
MTT S5000是摩尔线程基于平湖GPU架构推出的AI显卡,首次支持FP8,性能可以达到1024TFLOPS,而H100的FP8性能接近4000TFLOPS。
关于硅基流动与摩尔线程是如何优化S5000显卡的,详情可以参考他们的官方稿件,这件事可以说明国产的显卡尽管参数上可能还落后不少,但通过工程优化还能不断提升性能表现,某些方面是有意想不到的变化的。
摩尔线程现在不足的地方除了硬件规模和工艺受限等因素,软件生态当然也无法跟NVIDIA相比,但这部分随着国内厂商的通力合作已经在起变化,未来几年在硬件规模及软件生态不断发展下,不论是AI还是游戏卡,拿出让NVIDIA感受到压力的产品也不是没可能。
反视角的电车痴汉 遇见原味舔食者的囧图
《仙剑4重制版》已沉寂整整一年 评论区玩家饿疯了
还没上线就翻车!TGA压轴新作Steam页被贴LGBT标签
9分!IGN高分评《八方0》:大放异彩的RPG佳作
生成画面太没劲!小岛秀夫谈游戏中AI的真正用法
IGN年度最佳出炉!《光与影》压倒性投票夺冠