Intel第二代锐炫显卡架构解析
Intel第二代锐炫显卡采用全新的Xe2架构,该架构在上代Xe架构的基础上进行了全方位的优化升级,在架构效率、资源利用率以及兼容性等方面均有一定幅度的提升。Xe2的最大单位计算功能模块依旧是Render Slice(渲染切片),在每一个Render Slices中都包含了4个Xe Core和4组光线追踪单元。
Render Slices内部的第二代Xe Core是Xe2架构的基本组成部分,在每个Xe Core内又拥有8个512-bit的XVE(矢量引擎)与8个2048-bit的XMX引擎。此外,第二代Xe核心还新加入了256KB的本地共享缓存,可大幅减轻对二级缓存的依赖。
与上一代Intel锐炫A系列相比,第二代Xe core的核心性能提升70%,每瓦性能提升50%。
在全新的矢量引擎中,除了继续支持原生SIMD 16计算之外,还增加了对SIMD 32的支持。另外,全新的矢量引擎还支持矩阵扩展,包括INT2、INT4、INT8、FP16、BF16、TF32等数据类型,其中TF32是针对AI优化的一种数据格式。
需要提及的是,全新的矢量引擎还支持三路并发,包括FP、INT/EM、XMX,该方案可以有效提升指令调度和执行的效率,从而解决SIMD运算单元无法充分利用的问题。
Xe2架构还在光线追踪单元方面做了不小的改进,包括将traversal pipeline的数量提升到3个,box intersections增加到18个,triangle intersections增加到2个,并将BVH(层次包围体结构)的缓存扩展到了16KB。与初代Intel锐炫系列显卡相比,这些改进可大幅提升光线追踪单元的速度和效率,进而大幅提升游戏中的光线追踪渲染效率。
本次为大家带来的Arc B580显卡采用了BMG-G21芯片,该芯片集成了上述所有的技术,拥有5个Render Slices,20个Xe Core、160个XMX引擎,共计20组光线追踪单元。