RTX 4080 SUPER首发评测:AD103架构完全体 加料降价的4080替代品

2024-01-31 22:00:00 来源:游民星空[原创] 作者:听风飞舞 编辑:听风飞舞 浏览:loading

Stable diffusion AI绘画性能测试:

在前边我们提及过,RTX 40系列显卡使用的是第四代Tensor核心(也称张量核心),该核心的作用就是用于深度学习和AI运算方面。因此,RTX 40系列显卡在运行AI相关的Stable diffusion(AI绘画)软件时,会变得更加高效。

Stable diffusion的绘画原理是通过加载不同的模组(AI学习的数据库),然后输入自己想要的画面关键词,并进行部分调整(如权重,渲染次数,引擎等),来进行图像生成。

游民星空

在安装好相应的插件([TRT] sd_xl base_1.0_0.9vae)后,在Stable diffusion中可以就看到TensorRT(深度学习推理SDK)的选项卡了,如此即可实现利用NVIDIA RTX 40系列显卡中的Tensor核心来进行深度学习后的AI计算。

下边我将采用常规AI绘图方式,以及RTX 40系显卡的TensorRT绘图方式来进行对比。

两次AI绘图均采用设置如下:

在设置时,我们统一选择模组(AI学习库)为sd_xl_base_1.0_0.9vae.safetensors,采样步数为50,采样方法为Eular a,提示词相关系数为7,随机数种子为13,图片宽度和高度为1024×1024,总批次数为10,单批数量为1。

游民星空

首先是常规绘图模式,此时不加载NVIDIA专门的插件,以完全默认的状态仅调整参数来生成AI图像。

测试结果:未使用Tensor核心进行AI计算的RTX 4080 SUPER显卡总计生成图片用时为2分18.6秒(138.6秒)。

游民星空

之后选择[TRT] sd_xl base_1.0_0.9vae插件,其它参数和之前一样,再进行AI图像的生成。

测试结果:使用Tensor核心进行AI计算的RTX 4080 SUPER显卡总计生成图片用时1分19.7秒(79.7秒)。

测试感想:

从结果来看,开启[TRT] sd_xl base_1.0_0.9vae插件之后,启用Tensor核心来进行处理的RTX 4080 SUPER显卡生成一副标准图像的用时要比未开启该插件快了58.9秒,整体速度快了42%。

这对有需求快速出图,甚至是对图像精度有更高要求的用户来说,降低42%以上的等待时间可以说是提升了近一倍的工作效率。

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
友情提示:支持键盘左右键“← →”翻页
人喜欢
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏