征服4K光追游戏的最佳利器!华硕TUF RTX4090显卡性能实测

2022-10-12 09:35:25 来源:游民星空[原创] 作者:MadaoKing 编辑:MadaoKing 浏览:loading

升级的架构和DLSS3技术

GeForce RTX 40系显卡采用全新的NVIDIA Ada Lovelace架构打造,由台积电4N工艺制作,旗舰核心为AD102,集成了763亿集体管,是上代GA102的2.7倍,核心面积大小为608mm²,相比GA102的628mm²更小。

虽然NVIDIA Ada Lovelace架构整体延续了上一代Ampere的架构设计,但依然有一些细节设计上的升级。

游民星空
RTX 4090所使用的AD 102-300核心架构示意图

RTX 4090作为RTX 40系列显卡的首发旗舰产品,并没有采用完整规格的AD102芯片,而是关闭了8组TPC,在完整AD102芯片72组TPC的基础上保留了64组TPC,每个TPC内有2组SM簇,共128组SM簇。

游民星空
AD102的SM簇

每个SM簇里包含了64个FP32单元和64个FP32/INT32混合单元,可视作为128个FP32单元,因而每个SM簇内为128个CUDA;每个SM簇还配置了4个纹理单元、1个RT单元、4个Tensor单元,所以RTX 4090显卡拥有16384个流处理器单元、512个纹理单元、128个三代RT单元、512个Tensor单元。

如果单纯比较流处理器数量,RTX 4090是上一代旗舰RTX 3090Ti的1.52倍,理论上性能最大提升幅度大约在50~60%左右,但NVIDIA为Ada Lovelace架构重新设计第三代RT单元和第四代Tensor单元,其中三代RT单元进一步提升光追性能表现,这也是Ada Lovelace架构最大的升级。

游民星空
2代RT单元

游民星空
3代RT单元

和Ampere的2代RT单元相比,Ada Lovelace架构的3代RT单元新增加了“不透明微遮盖引擎”(OME)和“微网络位移引擎”(DM-ME)。

这两个引擎能够将光追计算中常遇到的操作进一步分工处理,提高整体效率,在节省更多计算资源的同时提高光追计算效率。

游民星空

除了架构上的升级之外,DLSS3技术是NVIDIA对外宣称的RTX 40系列显卡的最大卖点,DLSS3也被NVIDIA官方称为神经网络渲染新时代。

游民星空

根据NVIDIA的介绍,DLSS3技术包含了DLSS2、Reflex和Frame Generation三种NVIDIA技术,其中DLSS2和Reflex已经广泛被玩家们所熟知:DLSS技术是利用低分辨率渲染+AI填充像素的方式实现接近原生分辨率画面并大幅提升帧数的技术,Reflex是利用消除CPU渲染的无用帧,加快GPU的有效帧渲染速度,实现降低游戏响应延迟的技术,只有Frame Generation是这次RTX 40系列显卡所带来的全新技术。

Frame Generation直译为帧生成,该技术可以将光流估计和DLSS相结合,在现有帧之间插入精确的合成帧,实现帧数“翻倍”提升,让玩家获得更流畅的游戏体验,这也是NVIDIA公关敢于信誓旦旦的说RTX 4090显卡性能是RTX 3090Ti显卡4倍的原因——架构提升1倍×Frame Generation提升1倍=4倍性能提升。不过为了降低这“无中生有”的合成帧产生的延迟,DLSS3会强制开启Reflex,玩家无法自己手动关闭。

游民星空

目前已经有超过35款游戏和应用宣布即将支持DLSS3技术,首批游戏和应用将于10月推出,借助这次RTX 4090显卡首发的机会,我们也有幸可以抢先体验到DLSS3版本的《赛博朋克2077》和《F1 22》《逆水寒》等游戏。

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
友情提示:支持键盘左右键“← →”翻页
人喜欢
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏