游民星空 > 新闻中心 > 正文

再次夺回“帝王”宝座!GTX 690详细评测

2012-05-06 16:41:36 来源:zol 作者:未知 编辑:颜落 浏览:loading

● 高频好助手——SMX单元

SM是NVIDIA GPU的ALU团簇基本单元,在Kepler中SM部分的改进可谓翻天覆地,NVIDIA采用的全新的SMX单元彻底改变了传统的SM单元的内涵,它在赋予整个体系极高的性能功耗比的同时,直接导致了今天这样完整规格同时默认运行频率极高的Geforce GTX690的诞生。

Kepler所采用的SMX单元与Fermi的SM单元在逻辑结构上十分近似,都拥有完整的几何前端,线程仲裁机制,ALU团簇,Texture Array以及unified cache/shared和Register。除了没有后端之外,可以说一个SM/SMX单元在结构上已经趋近等同于一颗标准GPU了。

游民星空_
GK104逻辑架构

与Fermi的SM单元规模对应线程粒度单位warp(32 ALU VS 32 Thread)不同,Kepler的SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到了192个。与此同时,SMX单元的线程仲裁管理机制也得到了绝对数量上的放大。负责线程分派和发放管理的Warp Scheduler从过去的2个增加到了4个,与之对应的Dispatch Unit从过去的2个增加到了8个,Warp Scheduler与Dispatch Unit的比例提升变成了1:2。

游民星空_
SMX单元结构

在放大ALU团簇的同时,NVIDIA还进一步放大了与ALU团簇对应的Register。根据NVIDIA提供的资料,GK104架构中每个SMX的Register较之Fermi的SM放大了一倍,达到了65536X32bit的规模。

在Unified Cache体系方面,Kepler与传统的Fermi在结构上没有多大的差异,其L1/shared以及L2 cache的大小和比例均未发生变化,仍旧维持64K的L1/Shared以及128K/MC的L2尺寸。整个体系中最值得关注的变动来自L2 cache速度以及带宽的提升,NVIDIA称Kepler的L2 cache目前运行在分频状态下,默认运行频率是核心频率的一倍,这为GK104提供了比过去大得多的L2带宽,这为通用计算性能以及Texture性能的提升创造了有利的条件。

游民星空_
更为强劲的SMX性能

更大的ALU规模、更多的线程仲裁机制以及更大的寄存器缓冲为SMX带来了全新的性能表现,新的逻辑设计让Kepler的运算单元拥有了2倍于Fermi的性能功耗比。更高的能耗比为单卡双芯的设计减轻了很多功耗层面的负担,因此GeForce GTX690得意以完整的GK104芯片规模运行在更高的频率之上,并以此获得了毫无争议的性能王座。

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
友情提示:支持键盘左右键“← →”翻页
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏