开普勒架构全解析 GeForce GTX 680详尽性能评测

2012-03-23 15:34:36 来源：驱动之家作者：未知编辑：迦偌　浏览：loading

开普勒排头兵：GK104架构深入解析（5）

6、升级PolyMorph 2.0引擎

在前面的章节我们就提到Kepler SMX中的PolyMorph 引擎已经升级到第二代，这也是另外一个改进之处。两年前，随着DX11将曲面细分纳入规范，加之新型图形处理流水线的迫切需求，Fermi GF100架构设计了一种可扩展几何引擎PolyMorph，并为其配备专用的顶点拾取单元和曲面细分单元(Tessellator)，从而极大地提升了几何性能。而GF100之所以拥有出色的曲面细分性能，主要就归功于多达16个PolyMorph引擎。

PolyMorph引擎工作流程可分为五个阶段：顶点拾取、曲面细分、视口转换、属性设置、流式输出。每个阶段中的运算结果都会被发送到一个SM，由其执行游戏的着色程序并将结果返回到引擎中的下一个阶段，而五个阶段全部完成后结果就会发送到Raster引擎。

到了Kepler，GK104架构共计设计了8个PolyMorph引擎，每个SMX分配一个，虽然数量上相比GF100/110减少了一半，但这8个PolyMorph引擎都经过重新设计（NVIDIA称之为PolyMorph 2.0），处理性能方面每时钟周期可达上代的两倍。另外，得益于GK104 GTX 680超出约30%的时钟运行频率，在曲面细分性能上将会有显著提升。

根据NVIDIA提供的数据，GTX 680在曲面性能方面大幅超过GTX 580，并将对手HD 7970遥遥甩在身后，而且随着曲面细分系数的提高，领先幅度也随之拉大。在此，除了游戏之外，NVIDIA特别强调了曲面细分性能对于开发者的重要性，尤其是那些经常需要使用曲面细分以及编写有关曲面细分API的开发人员。

7、更高速的二级缓存

除了前面说的64KB片上存储（可配置为48KB共享存储器加16KB一级高速缓存，或者16KB共享存储器加48KB一级高速缓存）之外，Kepler还提供了大小为512KB的统一二级高速缓存，既能读又能写，为所有载入、存储、纹理请求提供服务，可在整个GPU中提供高效、高速的数据共享。

虽然容量不及Fermi GF100/110（768KB），但GK104的二级缓存带宽提升了近73%，而且原子存取操作吞吐量同样有大幅提高，尤其表现在单一普通地址的原子操作。下面的图标就简单概括了GK104二级缓存较GF110的提升。

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页

友情提示：支持键盘左右键“← →”翻页

文章内容导航

分享到：

纠错举报手机APP

查看全部