光追游戏性能比2080Ti平均提升30% RTX 3080显卡游民首测

2020-09-16 22:09:49 来源:游民星空[原创] 作者:Kalama 编辑:Alexeik 浏览:loading

第三代Tensor核心令DLSS效能更上一层楼

Tensor Core是伏特GPU引入的一种新核心,现在也是SM单元的三大子核心之一,不过在数据中心GPU上,AI加速功能非常重要,所以A100大核心的Tensor Core占据了相当大的面积,功能及性能都改进不少。

游民星空

GA102核心继承了GA100的第三代Tensor核心,每组SM单元也是4个Tensor Core,看上去相比Turing数量减半,但实则性能暴增。

Tensor在做深度学习、AI计算时大量实施FP16半精度计算,事实上将其称为半精度计算单元也不为过。NVIDIA通过寄存机制改进将其原有的半精度计算操作分别拆成密集计算和发散计算,分别应对不同层级的AI计算,使与游戏应用关联最大的DLSS效能得到进一步优化,在DLSS2.0本已不俗的表现上锦上添花,使8K分辨率流畅运行游戏变为可能。

不过8K还比较遥远,显卡跟上了还得显示器跟上,现在能玩好4K就很知足了,这属于未雨绸缪的性能储备。

带宽堪比HBM2的GDDR6X显存

除了GPU本体之外,显存技术这一代也升级了,上代的Turing GPU首发了GDDR6显存,这一次NVIDIA又迅速商业化了GDDR6X显存,其中RTX 3090不仅频率飙上了19.5Gbps,还达到了24GB超大容量。

游民星空

GDDR6X基于目前的GDDR6升级而来,基本架构和技术保持不变,重点加入了PAM4信令机制,在处理器和内存之间,使用四档电压,每个周期内编码可传输两个比特位,这样每周期单沿数据传输率便可达物理频率的8倍,比DDR6翻了一番。

游民星空

对于PAM4机制,大家可以理解为闪存从SLC到MLC的升级,使每周期传输的数据量得以翻倍,由此实现了超高速率的等效频率,起步就可以做到21Gbps。考虑到设计、工艺等各方面成熟度的问题,NVIDIA前期应用的频率还是略保守的,RTX 3080是公版标准是19Gbps。

使用GDDR6X显存之后,在等效带宽提升50%的情况下,能效也提升了,每bit功耗降低了15%。

游民星空

如今GDD6X就可以实现HBM2显存的1TB/s带宽,但又不需要后者那么复杂的工艺和成本,在消费级显卡上真的可以不需要考虑HBM2了。

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
友情提示:支持键盘左右键“← →”翻页
文章内容导航
人喜欢
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏