产品规格及核心介绍:
按照惯例,我们还是列了一个规格表,以便大家对这代显卡的无后缀版RX 9070及上代的RX 7900 GRE显卡有一个比较直观的了解。
需要说明的是,虽然上表格参与对比的上代显卡是,RX 7900GRE,但是在RX 7000系显卡中,RX 7900系列定位是高端,而新一代的RX 9070系列定位则是中端,因此上图仅做参考即可。
通过上图可以发现,RX 9070 GRE仍沿用Navi 48核心,只是在流处理器等方面有所减少,显存也由16GB变成了12GB,无限缓存则是由64MB变成了48MB。但是奇怪的是,该卡与RX 9070一样供电功耗仍为220W。
相较于RDNA3架构,RDNA4除了重新整合成一个完整的核心Die之外,在CU单元方面也做了升级。
CU单元的提升主要体现在4个方面:增强型的显存管理,动态的寄存器分配,扩展的标量指令集以及更高的效率和时钟速度。
新的存储架构将通过优化排队机制,来更高效地处理显存的请求以达到减少延迟和提高带宽利用率的效果。
在SIMD向量单元中,RDNA4采用了全新的动态寄存器分配制度,来提高程序执行的效率。
在标量单元指令集中,加入了浮点运算指令。
注意,在前边表格中我们提到的CU单元类型为“双CU单元”,这是因为RDNA4架构中2个CU单元共享Memory以及Cache,这样的物理设计优化,可以显著的提升运算效率和时钟速度。
在第三代光追加速器方面,RDNA4采用了全新的光线变换引擎(Ray Transform)和两个光线交叉引擎(Intersection Engine)的设计,1+2的设计使得对于光线变换的处理和光线交叉测试的性能直接翻倍。
并且,RDNA4引入了一个全新的技术“定向包围盒”,该技术能够增加光线穿越的效率且降低显存的消耗,更好的利用显存的容量和带宽。
在第二代AI加速器方面,新的RDNA4可以支持16bit、8bit以及4bit的低精度计算。