图灵架构与Volta架构间的抉择
RTX2070在技术方面与RTX2080/2080Ti保持一致,差别仅是在核心上的不同,但为保证各位读者可以更为全面得了解这款显卡,我们会用最通俗易懂的语言来向各位介绍RTX20系显卡重要的革新。
从英伟达以前的显卡架构更迭规律来看,新一代旗舰显卡都是基于该架构的首款TITAN,所以在9月显卡正式亮相前,人们对新产品架构的遐想也都是基于去年发布的TITAN V得Volta架构,但图灵架构的横空出世给予了新显卡更多可能。
从具体数据上看,跟上一代帕斯卡(Pascal)架构相比,同等同频的CUDA,图灵架构的性能高出帕斯卡50%,更别提新的图灵芯片集成186亿晶体管远超帕斯卡118亿晶体管的数量,让图灵架构达到了完全碾压帕斯卡的层级。但对比Volta架构210亿个晶体管,貌似图灵反而处在劣势,那么在最新的顶级游戏显卡中为何没有使用Volta呢?这得Volta本身说起。
英伟达在包装Volta架构时主要强调了其强大的通算能力,与全新专业处理模块——Tensor Core(张量计算核心)带来的超强AI计算性能。再配合Volta的其他微架构改进,以及支持深度学习和HPC(高性能计算)的软件/框架集成在一起,英伟达看起来使用非常合理设计加以全新黑科技的支持,让Volta成为规模超大性能最强的架构。
但实际上Volta并非那么完美,看似Volta的CUDA规模巨大是为了让显卡拥有更强劲的运算能力,但事实上是由于无法达到7nm的制作工艺,Volta只能通过增加晶体管和面积来硬撑CUDA的规模来换取足量的浮点运算能力,如此行径让Volta并没有达到应有的图形性能,且核心面积太过巨大导致成本大幅升高良品率降低,让使用该架构的显卡完全脱离消费层级,英伟达只能定以高价把它当做游戏与专业图形双用途显卡售卖。
再回过头来看图灵架构较少的晶体管与核心规格实则是英伟达在架构设计上的思路转变,让图灵并没有成为一个靠堆积核心数量来增加运算能力的架构,反而是通过复合运算技巧的特殊算法来组成全新的框架,将AI计算和图形计算进行混合,让架构中的CUDA和Tensor协同工作,以此让着色器直接获得更为强劲的性能。这也就是图灵架构即使CUDA规模不大也能实现颠覆之前架构图像运算性能的原因。
当然,图灵架构也并非全方面优于Volta架构,比如Volta拥有的双浮点运算(FP64)并不被图灵支持。从另一方面来看,图灵缩减CUDA与核心面积其实是在为“实时管线追踪”的加速核心RT CORE让路,用新技术的加持和复合技巧运算来获得超强的图形性能。
从实际表现来看,早在ChinaJoy中展示的一款植入了RTX技术的《星球大战》游戏DEMO需要四张Volta架构GeForce专业图形卡才能驾驭,现在只需要一张采用Turing构架的GeForce RTX 2080 Ti显卡即可实现。这足可见图灵架构带来的质的飞跃。
综上所述,Volta其实是英伟达在转变思路后战略性放弃的显卡架构,并非说Volta被图灵完全碾压,但图灵架构至少是包含了Volta几乎大部分技术与性能,并拥有更有发展空间的光线追踪技术的复合型架构,而单从CUDA数量来判断图灵架构性能提升较小,是一种非常不负责任的说法。