双GF110 整合:GTX 590核心架构介绍
回顾完NVIDIA历代双芯旗舰卡,下面回顾到GeForce GTX 590身上。虽然采用两个GF110核心已经是世人皆知,我们还是有必要对其简要回顾一下。在GeForce GTX 580首发评测中我们就曾经提到,GF110并非一颗实际意义上的“新核心”,而是在GF100核心基础上经过大量细节改进并开启完整512个CUDA核心而来,至于核心内部的架构安排则与GF100保持一致。
与GF100一样,GF110核心内部同样包括以下几个模块:主接口(Host Interface)、GigaThread引擎、4个图形处理器集群(GPC)、6个64位GDDR5显存控制器、6个ROP分区(每个分区包含8个ROPs)、768KB二级缓存,其中每个GPC包含四组流式多处理器(SM)、4个PolyMorph引擎、1个Raster引擎,而每个流式多处理器内又有32个流处理器(CUDA核心)、4个纹理单元。所以总的结果就是GF110拥有512个流处理器、64个纹理单元、32个光栅单元、16个PolyMorph引擎、4个Raster引擎以及768KB二级缓存。至于GeForce GTX 590,以上所有规格翻倍就是了。
虽然核心架构毫无变化,NVIDIA却明确表示,GF110并不是在GF100晶圆上选择可以稳定开启512个流处理器的核心而来,而是来自一块需要重新流片的全新晶圆,其中包含了NVIDIA工程师们对核心中的大量细节改进。主要包括以下两点:
1. 优化设计实现的算法升级,尤其是纹理过滤(Texture Filting)和Z轴压缩(Z-Cull)两大算法的更新,让相应指令的操作效率大大提升。虽然在宏观上的架构图没有变化,但NVIDIA同样称这一微观升级举措为“架构增强”。比如,GF110的纹理单元设计实际上类似于GF104,每个时钟周期可以进行4次64bit/FP16纹理采样,而不是GF100的2次。
2. 半导体芯片制造技术的改进,通过对核心元器件生产工艺的升级以及半导体自身特性的优化。在仍基于台积电40nm工艺的前提下,GF110可以运行在更高的频率下,并能够让开满512个CUDA核心,16个多形体引擎的芯片满足量产需求。
经过以上两个主要改进,加上流处理器的增加以及频率的提升,采用GF110核心的GeForce GTX 580相比采用GF100核心的GeForce GTX 480有了明显的性能提升。客观来说,NVIDIA在GF110核心上的做法收到了十分不错的效果,相比更新周期长研发难度大的全新架构,仅仅通过部分构架改进以及流处理器/频率的提升,就获得如此的性能提升幅度是相当难得的。
得益于GF110的良好表现,搭载两个GF110的GeForce GTX 590性能自然可想而知。据NVIDIA介绍,GeForce GTX 590综合性能达到了GeForce GTX 580的1.5倍以上,在绝大部分游戏中也要胜过同样单卡双芯的Radoen HD 6990。当然以上数据均有NVIDIA官方提供,实际表现还需测试验证。