RTX 4080 SUPER首发评测：AD103架构完全体加料降价的4080替代品

2024-01-31 22:00:00 来源：游民星空[原创] 作者：听风飞舞编辑：听风飞舞　浏览：loading

Stable diffusion AI绘画性能测试：

在前边我们提及过，RTX 40系列显卡使用的是第四代Tensor核心（也称张量核心），该核心的作用就是用于深度学习和AI运算方面。因此，RTX 40系列显卡在运行AI相关的Stable diffusion（AI绘画）软件时，会变得更加高效。

Stable diffusion的绘画原理是通过加载不同的模组（AI学习的数据库），然后输入自己想要的画面关键词，并进行部分调整（如权重，渲染次数，引擎等），来进行图像生成。

在安装好相应的插件（[TRT] sd_xl base_1.0_0.9vae）后，在Stable diffusion中可以就看到TensorRT（深度学习推理SDK）的选项卡了，如此即可实现利用NVIDIA RTX 40系列显卡中的Tensor核心来进行深度学习后的AI计算。

下边我将采用常规AI绘图方式，以及RTX 40系显卡的TensorRT绘图方式来进行对比。

两次AI绘图均采用设置如下：

在设置时，我们统一选择模组（AI学习库）为sd_xl_base_1.0_0.9vae.safetensors，采样步数为50，采样方法为Eular a，提示词相关系数为7，随机数种子为13，图片宽度和高度为1024×1024，总批次数为10，单批数量为1。

首先是常规绘图模式，此时不加载NVIDIA专门的插件，以完全默认的状态仅调整参数来生成AI图像。

测试结果：未使用Tensor核心进行AI计算的RTX 4080 SUPER显卡总计生成图片用时为2分18.6秒（138.6秒）。

之后选择[TRT] sd_xl base_1.0_0.9vae插件，其它参数和之前一样，再进行AI图像的生成。

测试结果：使用Tensor核心进行AI计算的RTX 4080 SUPER显卡总计生成图片用时1分19.7秒（79.7秒）。

测试感想：

从结果来看，开启[TRT] sd_xl base_1.0_0.9vae插件之后，启用Tensor核心来进行处理的RTX 4080 SUPER显卡生成一副标准图像的用时要比未开启该插件快了58.9秒，整体速度快了42%。

这对有需求快速出图，甚至是对图像精度有更高要求的用户来说，降低42%以上的等待时间可以说是提升了近一倍的工作效率。

友情提示：支持键盘左右键“← →”翻页

文章内容导航

人喜欢

游民星空APP

随时掌握游戏情报

新浪微博 QQ 微信

举报| 收藏|

休闲娱乐

综合热点资讯

单机游戏下载

好物推荐

游民星空联运游戏

RTX 4080 SUPER首发评测：AD103架构完全体 加料降价的4080替代品