其实Maxwell之所以会有这么强大的执行效率,主要还是和架构本身的特性有关,从Maxwell初代产品GeForce GTX 750/ GeForce GTX 750 Ti来看,首先是SMM单元中的逻辑控制器数量有着本质提升,同时每一组SMM单元中的CUDA核心数量也有着非常恐怖的提升。所以效率更高,而且能耗比也更强力。
前两代旗舰显卡所采用的Kepler架构,最令人蛋疼的一点是每一个GPC单元用的是一个半的显存控制器,这在执行效率上有着非常不好的影响。而且单个GPC单元中所包含的SMM单元只有4个,这就导致了显卡功耗一直居高不下,同样使用16组SMM单元渲染,在Maxwell架构中可能只需要动用两个GPC单元+两个显存控制器,而在Kepler架构中就需要用到全部的GPC单元,每个GPC单元中的CUDA核心利用率却不是很完全,这也是为啥Maxwell架构执行效率这么高。
而最令人感到惊讶的是,作为一块旗舰级显卡,GeForce GTX 980的辅助供电仅有6+6PIN,NVIDIA给出的显卡TDP居然仅有165W,相对于上代旗舰GeForce GTX 780来说,功耗降低了几乎一半,这首先要归功于流处理器数量的缩减,GeForce GTX 780拥有2304个流处理器单元,但是执行效率并不是很高,对于某些钻牛角尖的应用程序来说,有大量的核心单元在“光吃饭不干活”,而GeForce GTX 980则很好的杜绝了这一现象,所以流处理器数量有着明显降低,流处理器少了,吃饭的嘴就少了,功耗也就下去了;另外一点是显存带宽的降低,之前带宽缩水的疑问也终于得到了解答,在Maxwell架构中,每8组SMM单元公用一个显存控制器,所以对于显存的应用效率也能得到有效的提升,显存控制器的执行效率变得更高,带宽只要不低得离谱,实际上也无关紧要了。