Blackwell新架构—全面革新带来史诗级提升
随着游戏玩家对高清画面与更高帧率追求的日益提升,传统渲染方式已逐渐力不从心,其提升视觉质量的效率已经无法跟上游戏玩家们日益增长的需求。
NVIDIA最新一代的GeForce RTX 50系列显卡采用了全新的Blackwell架构,该架构划时代的将神经网络集成到可编程着色器内,创建了全新的神经网络着色器,通过AI与神经渲染相结合的方式,将游戏画质和游戏帧率提升到了全新高度。
与上一代的Ada Lovelace架构相比,全新的Blackwell架构采用了全新的针对神经着色器进行优化的Blackwell SM,搭载了最新的第五代Tensor Core和第四代RT Core,支持全新的FP4精度计算模式,引入了全新的AMP(AI Management Processor),并应用了全新的GDDR7显存、DLSS 4等新技术。
NVIDIA Blackwell的旗舰芯片代号为GB202,采用台积电为NVIDIA定制的TSMC 4N工艺,集成了922亿晶体管,核心面积为750mm²。
与上代的AD102结构类似,完整的GB202 GPU同样由12个GPC(Graphics Processing Clusters)构成,每个GPC都包括一个光栅引擎,两个光栅操作(ROPs)分区,每个分区又包含八个单独的ROP单元,即完整的GB202 GPU拥有192个ROPs。
与上代AD102不同的是,GB202每个GPC下的TPC(Texture Processing Clusters)数量由上代的6个提升到了8个,每个TPC又包含一个PolyMorph引擎与两个SM(Streaming Multiprocessor),即完整的GB202 GPU共拥有96个TPC,192个SM。
完整的GB202 GPU包括128MB的二级缓存,显存控制器内建16个32bit端口,显存位宽一共512-bit。
与上代Ada Lovelace架构SM针对标准着色器进行设计和优化不同的是,全新Blackwell架构下的SM主要针对神经着色器进行设计和优化,通过将INT32与FP32集成为一类,并进一步提升了神经网络着色工作负载排序(SER)的速度与精度,从而提升神经着色器的效率。Blackwell SM还加入了支持全新FP4运算的第五代Tensor Core,在成倍提升AI吞吐量的同时,还能大幅降低显存需求。
Blackwell架构中的每个SM都包含128个CUDA核心、1个第四代RT Core、4个第五代Tensor Core、4个纹理单元和128KB L1缓存,即完整的GB202拥有24576个CUDA,192个RT Core,768个Tensor Core,768个纹理单元,以及24 MB L1缓存。
与完整的GB202 GPU相比,GeForce RTX 5090 D所使用的GPU核心阉割了1个完整GPC和其中1个GPC中的3个TPC,即GeForce RTX 5090 D的GPU由11个GPC构成,其中10个GPC包含8个TPC,1个GPC包含5个TPC,每个TPC拥有2个SM,共计为170个SM,即21760个CUDA。
通过简单计算可以发现,GeForce RTX 5090 D显卡GPU的完整度约为88.5%,与上代RTX 4090的完整度十分接近。
在与往期显卡进行参数对比之前,我们先来聊一下颇受大家关注的问题。与此前GeForce RTX 4090 D削减多项规格不同的是,GeForce RTX 5090 D与GeForce RTX 5090的绝大部分规格都完全一致,只有AI算力有一定程度的缩水,固而在上表中我们并没有放入GeForce RTX 5090的相关参数信息。
不过需要提及的是,虽然从参数上面来看GeForce RTX 5090 D与GeForce RTX 5090基本一致,但是遗憾的是我们并没有收到GeForce RTX 5090显卡,因此本次无法对比二者在实际游戏与应用的差别。
通过NVIDIA GeForce RTX 5090 D与往期旗舰显卡型号的参数明细对比不难发现,与上代GeForce RTX 4090甚至上上代GeForce RTX 3090相比,全新一代的GeForce RTX 5090 D GPU几乎做到了全方位提升,显存、CUDA、Tensor Core、RT Core、PCIe、DLSS等全面革新,大幅度的拉高了RTX 50系列显卡的性能上限。
值得一提的是,Blackwell架构还应用了全新的电源门技术,可通过三种不同的门实现单独微调显卡内部不活跃部件,配合Blackwell大幅提升的频率切换速度,从而实现高效与节能,让GeForce RTX 50系列显卡在能效方面也有一定提升。
另外在编解码方面,Blackwell架构的编码器从Ada的第八代升级到了第九代,解码器也从Ada的第五代升级到了第六代,即Blackwell支持AV1 UHQ、MV-HEVC,2*H.264解码,以及4 2 2格式的硬件编解码,对于内容创作者来说是十分实用的升级。