Stable diffusion AI绘画性能测试:
在前边我们提及过,RTX 4070 Super显卡使用的是第四代Tensor核心(也称张量核心),该核心的作用就是用于深度学习和AI运算方面。因此,RTX 40系列显卡在运行AI相关的Stable diffusion(AI绘画)软件时,会变得更加高效。
Stable diffusion的绘画原理是通过加载不同的模组(AI学习的数据库),然后输入自己想要的画面关键词,并进行部分调整(如权重,渲染次数,引擎等),来进行图像生成。
在安装好相应的插件([TRT] sd_xl base_1.0_0.9vae)后,在Stable diffusion中可以就看到TensorRT(深度学习推理SDK)的选项卡了,如此即可实现利用NVIDIA RTX 40系列显卡中的Tensor核心来进行深度学习后的AI计算。
下边我将采用常规AI绘图方式,以及RTX 40系显卡的TensorRT绘图方式来进行对比。
两次AI绘图均采用设置如下:
首先选择模组(AI学习库)为sd_xl_base_1.0_0.9vae.safetensors,采样步数为50,采样方法为Eular a,提示词相关系数为7,随机数种子为13,图片宽度和高度为1024×1024,总批次数为10,单批数量为1。
首先我们选择常规绘图模式,此时不加载NVIDIA专门的插件,以完全默认的状态仅调整参数来生成AI图像。
测试结果:总计生成图片用时为3分49秒(229秒)。
之后我们选择[TRT] sd_xl base_1.0_0.9vae插件,其它参数和之前一样,再进行AI图像的生成。
测试结果:总计生成图片用时1分56.9秒(116.9秒)。
测试感想:
NVIDIA RTX 40系显卡第四代的Tensor核心在AI绘画方面算是得到了更加广泛的应用,使用该项核心支持的技术来进行绘画,其用时要大幅领先于标准设置,可以说提升了非常大的工作效率。