产品规格及核心介绍:
按照惯例,我们还是列了一个规格表,以便大家对这代及上代显卡有一个直观的了解。
值得一提的是,RX 9070 XT和RX 9070采用了16GB的显存,在显存容量方面要逊色于上代的RX 7900 XTX(24GB)以及RX 7900 XT(20GB)。
所以仅看表面规格来说,两款显卡的对位上代型号应该是同为16GB显存的RX 7900 GRE。
不过,虽然RX 9070 XT采用了第二代AI加速器和第三代光追加速器,但是在数量上,仍逊色于RX 7900 GRE。
相较于RDNA3架构,RDNA4除了重新整合成一个完整的核心Die之外,在CU单元方面也做了升级。
CU单元的提升主要体现在4个方面:增强型的显存管理,动态的寄存器分配,扩展的标量指令集以及更高的效率和时钟速度。
新的存储架构将通过优化排队机制,来更有效率的处理显存的请求以达到减少延迟和提高带宽利用率的效果。
而在SIMD向量单元中,RDNA4采用了全新的动态寄存器分配制度,来提高程序执行的效率。
而在标量单元指令集中,加入了浮点运算指令。
注意,在前边表格中我们提到的CU单元类型为“双CU单元”,这是因为RDNA4架构中2个CU单元共享Memory以及Cache,这样的物理设计优化,可以显著的提升运算效率和时钟速度。
而在第三代光追加速器方面,RDNA4采用了全新的光线变换引擎(Ray Transform)和两个光线交叉引擎(Intersection Engine)的设计,1+2的设计使得对于光线变换的处理和光线交叉测试的性能直接翻倍。
并且,RDNA4引入了一个全新的技术“定向包围盒”,该技术能够增加光线穿越的效率且降低显存的消耗,更好的利用显存的容量和带宽。
在第二代AI加速器方面,新的RDNA4可以支持16bit、8bit以及4bit的低精度计算。