UL Procyon AI image对比测试
UL Procyon是UL Solutions推出的一套基准测试套件,旨在为硬件制造商、零售商、企业IT部门、媒体和公共部门等提供一系列准确、相关、公正的基准测试。软件中每个测试都是针对特定用例设计的,并在可能的情况下使用实际的应用程序,以确保测试结果的准确性和实用性。
本次我们所采用的测试项目为FLUX.1 AI Image Generation Demo for NVIDIA,该项目能提供一致、准确且可理解的工作负载,以便对设备上 AI 加速器的推理性能进行测量。该基准测试包含四项测试,分别是FLUX.1 Dev(FP8)、FLUX.1 Schnell(FP8)、FLUX.1 Dev(FP4)、FLUX.1 Schnell(FP4),本次我们采用的是FLUX.1 Dev(FP4),工作负载版本为1.1.177。
UL Procyon FLUX.1 Dev(FP4,工作负载版本为1.1.177)测试(NVIDIA GeForce RTX 5080 FE 16GB)
在UL Procyon FLUX.1 Dev(FP4,工作负载版本为1.1.177)测试中,NVIDIA GeForce RTX 5080 FE 16GB显卡的总体图像生成速度为8.996 s/image,总体消耗时间为35.984 s。
UL Procyon FLUX.1 Dev(FP4,工作负载版本为1.1.177)测试(微星 RTX 5070 Ti 16G GAMING TRIO OC PLUS 魔龙)
在UL Procyon FLUX.1 Dev(FP4,工作负载版本为1.1.177)测试中,微星 RTX 5070 Ti 16G GAMING TRIO OC PLUS 魔龙显卡的总体图像生成速度为10.346 s/image,总体消耗时间为41.386 s。
UL Procyon FLUX.1 Dev(FP4,工作负载版本为1.1.177)测试(NVIDIA GeForce RTX 4080 16GB)
在UL Procyon FLUX.1 Dev(FP4,工作负载版本为1.1.177)测试中,NVIDIA GeForce RTX 4080 16GB显卡的总体图像生成速度为29.564 s/image,总体消耗时间为118.255 s。
通过实测我们发现,在UL Procyon FLUX.1 Dev(FP4)测试中,搭载全新第五代Tensor Core的GeForce RTX 5070 Ti显卡的性能要远超上代定位更高的GeForce RTX 4080显卡,具体在总体图像生成速度方面的优势接近3倍。而与本代次旗舰GeForce RTX 5080相比,GeForce RTX 5070 Ti显卡的图像生成速度则落后了约13%。
需要提及的是,由于UL Procyon FLUX.1 Dev测试需要采用NVIDIA RTX GPU,且至少需要16GB显存,而NVIDIA GeForce RTX 4070 Ti显卡的显存只有12GB,并不能顺利完成这个测试。