游民星空 > 新闻中心 > 正文

开普勒架构全解析 GeForce GTX 680详尽性能评测

2012-03-23 15:34:36 来源:驱动之家 作者:未知 编辑:迦偌 浏览:loading

开普勒排头兵:GK104架构深入解析(5)

6、升级PolyMorph 2.0引擎

在前面的章节我们就提到Kepler SMX中的PolyMorph 引擎已经升级到第二代,这也是另外一个改进之处。两年前,随着DX11将曲面细分纳入规范,加之新型图形处理流水线的迫切需求,Fermi GF100架构设计了一种可扩展几何引擎PolyMorph,并为其配备专用的顶点拾取单元和曲面细分单元(Tessellator),从而极大地提升了几何性能。而GF100之所以拥有出色的曲面细分性能,主要就归功于多达16个PolyMorph引擎。

游民星空_

PolyMorph引擎工作流程可分为五个阶段:顶点拾取、曲面细分、视口转换、属性设置、流式输出。每个阶段中的运算结果都会被发送到一个SM,由其执行游戏的着色程序并将结果返回到引擎中的下一个阶段,而五个阶段全部完成后结果就会发送到Raster引擎。

游民星空_

到了Kepler,GK104架构共计设计了8个PolyMorph引擎,每个SMX分配一个,虽然数量上相比GF100/110减少了一半,但这8个PolyMorph引擎都经过重新设计(NVIDIA称之为PolyMorph 2.0),处理性能方面每时钟周期可达上代的两倍。另外,得益于GK104 GTX 680超出约30%的时钟运行频率,在曲面细分性能上将会有显著提升。

游民星空_

根据NVIDIA提供的数据,GTX 680在曲面性能方面大幅超过GTX 580,并将对手HD 7970遥遥甩在身后,而且随着曲面细分系数的提高,领先幅度也随之拉大。在此,除了游戏之外,NVIDIA特别强调了曲面细分性能对于开发者的重要性,尤其是那些经常需要使用曲面细分以及编写有关曲面细分API的开发人员。

7、更高速的二级缓存

除了前面说的64KB片上存储(可配置为48KB共享存储器加16KB一级高速缓存,或者16KB共享存储器加48KB一级高速缓存)之外,Kepler还提供了大小为512KB的统一二级高速缓存,既能读又能写,为所有载入、存储、纹理请求提供服务,可在整个GPU中提供高效、高速的数据共享。

虽然容量不及Fermi GF100/110(768KB),但GK104的二级缓存带宽提升了近73%,而且原子存取操作吞吐量同样有大幅提高,尤其表现在单一普通地址的原子操作。下面的图标就简单概括了GK104二级缓存较GF110的提升。

游民星空_

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
友情提示:支持键盘左右键“← →”翻页
文章内容导航
分享到:
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏