Stable diffusion相关测试
在GeForce RTX 4070 SUPER显卡首发的的时候,我们就曾为大家带来过该功能的介绍:点击这里。
由于RTX 40系列显卡使用的是第四代Tensor(张量)核心,该核心的作用就是用于深度学习和AI运算方面。因此,RTX 40系列显卡在运行AI相关的Stable diffusion(AI绘画)软件时,会变得更加得心应手。
而Stable diffusion的绘画原理是通过用户输入自己想要的画面关键词,并进行部分调整(如权重,渲染次数,引擎等),来进行图像生成。
就好比你是一个甲方,需要修改哪里,只需要输入相应的关键词即可,剩下的便是由AI来根据你的意思进行修改。
当然了,AI绘画是需要不断通过学习积累的,根据不同的需要,AI的学习过程也有所不同,比如二次元风,水墨风甚至写实风等等。这些不断歇息的过程就是一个个不同的模组(AI学习的数据库)了,所以AI绘画除了相应的关键词外,还需要相应的模组库才行。
在下载并引用相关插件后,即可在Stable Diffusion中增添“TensorRT”标签,之后再经过一系列设定,就能通过TensorRT来加速AI绘画。
本次Stable Diffusion测试分为两个部分,第一部分:
显卡分别为影驰RTX 4070 Ti SUPER大将与RTX 3070 Ti,测试选用模型为sd_v1-5-pruned-emaonly,测试中所选择的采样方法是Eular a,采样步数为50,图片宽度和高度为512×512,提示词相关系数为7,总批次数为10,单批数量为1,随机数种子为13(确保中可以生成相同的图像)。
需要提及的是,由于RTX 3070 Ti并不支持TensorRT加速,所以仅使用该显卡测试了Stable Diffusion常规绘图。
Stable Diffusion常规绘图(NVIDIA GeForce RTX 3070 Ti显卡),总计用时51.3秒,平均每分钟可生成11.7张图像
Stable Diffusion常规绘图(影驰RTX 4070 Ti SUPER大将显卡),总计用时33秒,平均每分钟可生成18.2张图像
经过TensorRT加速的Stable Diffusion绘图(影驰RTX 4070 Ti SUPER大将显卡),总计用时22.3秒,平均每分钟可生成26.9张图像
通过对比测试可以发现,同样使用SD V1.5进行Stable Diffusion常规绘图,使用RTX 4070 Ti SUPER显卡要比RTX 3070 Ti的性能强56%。而加入支持RTX 4070 Ti SUPER的TensorRT加速后,RTX 4070 Ti SUPER显卡的AI绘图效率要比RTX 3070 Ti高出130%,即便对比未开启TensorRT加速的RTX 4070 Ti SUPER显卡本身,开启TensorRT加速后也拥有48%的效率提升,可以给予用户更加快速的AI生成体验。
第二部分:
测试显卡为影驰RTX 4070 Ti SUPER大将,测试选用模型为sd_xl_base_1.0_0.9vae,测试中所选择的采样方法是Eular a,采样步数为50,图片宽度和高度为1024×1024,提示词相关系数为7,总批次数为10,单批数量为1,随机数种子为13(确保中可以生成相同的图像)。
Stable Diffusion常规绘图,总计用时166.7秒,平均每分钟可生成3.6张图像
经过TensorRT加速的Stable Diffusion绘图,总计用时99.2秒,平均每分钟可生成6.05张图像
经过TensorRT加速后,用户能够获得68%的AI生成速度。
除了RTX 4070 Ti SUPER显卡之外,这里我们还尝试使用RTX 3070 Ti显卡进行测试,其在相同模型相同设定下生成图片时的预计耗时为30分钟,与RTX 4070 Ti SUPER差别较大,说明该设定对RTX 3070 Ti显卡的压力还是比较大的。
测试感想:
NVIDIA RTX 40系显卡第四代的Tensor核心在AI绘画方面算是得到了更加广泛的应用,使用该项核心支持的技术来进行绘画,其用时要大幅领先于标准设置,可以说提升了非常大的工作效率。