RTX 4070 Ti SUPER显卡首测：16G/256bit显存不惧4K游戏

2024-01-23 22:08:05 来源：游民星空[原创] 作者：Alexeik 编辑：Alexeik　浏览：loading

Stable diffusion相关测试

在GeForce RTX 4070 SUPER显卡首发的的时候，我们就曾为大家带来过该功能的介绍：点击这里。

由于RTX 40系列显卡使用的是第四代Tensor（张量）核心，该核心的作用就是用于深度学习和AI运算方面。因此，RTX 40系列显卡在运行AI相关的Stable diffusion（AI绘画）软件时，会变得更加得心应手。

而Stable diffusion的绘画原理是通过用户输入自己想要的画面关键词，并进行部分调整（如权重，渲染次数，引擎等），来进行图像生成。

就好比你是一个甲方，需要修改哪里，只需要输入相应的关键词即可，剩下的便是由AI来根据你的意思进行修改。

当然了，AI绘画是需要不断通过学习积累的，根据不同的需要，AI的学习过程也有所不同，比如二次元风，水墨风甚至写实风等等。这些不断歇息的过程就是一个个不同的模组（AI学习的数据库）了，所以AI绘画除了相应的关键词外，还需要相应的模组库才行。

在下载并引用相关插件后，即可在Stable Diffusion中增添“TensorRT”标签，之后再经过一系列设定，就能通过TensorRT来加速AI绘画。

本次Stable Diffusion测试分为两个部分，第一部分：

显卡分别为影驰RTX 4070 Ti SUPER大将与RTX 3070 Ti，测试选用模型为sd_v1-5-pruned-emaonly，测试中所选择的采样方法是Eular a，采样步数为50，图片宽度和高度为512×512，提示词相关系数为7，总批次数为10，单批数量为1，随机数种子为13（确保中可以生成相同的图像）。

需要提及的是，由于RTX 3070 Ti并不支持TensorRT加速，所以仅使用该显卡测试了Stable Diffusion常规绘图。

Stable Diffusion常规绘图（NVIDIA GeForce RTX 3070 Ti显卡），总计用时51.3秒，平均每分钟可生成11.7张图像

Stable Diffusion常规绘图（影驰RTX 4070 Ti SUPER大将显卡），总计用时33秒，平均每分钟可生成18.2张图像

经过TensorRT加速的Stable Diffusion绘图（影驰RTX 4070 Ti SUPER大将显卡），总计用时22.3秒，平均每分钟可生成26.9张图像

通过对比测试可以发现，同样使用SD V1.5进行Stable Diffusion常规绘图，使用RTX 4070 Ti SUPER显卡要比RTX 3070 Ti的性能强56%。而加入支持RTX 4070 Ti SUPER的TensorRT加速后，RTX 4070 Ti SUPER显卡的AI绘图效率要比RTX 3070 Ti高出130%，即便对比未开启TensorRT加速的RTX 4070 Ti SUPER显卡本身，开启TensorRT加速后也拥有48%的效率提升，可以给予用户更加快速的AI生成体验。

第二部分：

测试显卡为影驰RTX 4070 Ti SUPER大将，测试选用模型为sd_xl_base_1.0_0.9vae，测试中所选择的采样方法是Eular a，采样步数为50，图片宽度和高度为1024×1024，提示词相关系数为7，总批次数为10，单批数量为1，随机数种子为13（确保中可以生成相同的图像）。

Stable Diffusion常规绘图，总计用时166.7秒，平均每分钟可生成3.6张图像