游民星空 > 新闻中心 > 正文

GeForce GTX 480/470架构技术疑点解答

2010-03-29 18:10:41 来源:驱动之家 作者:未知 编辑:颜落 浏览:loading

GeForce GTX 480/470的评测文章中,我们曾对GF100架构进行了较为深入的阐述,但因为种种原因还是遗漏了很多内容,而且有不少地方就连NVIDIA也没有说清楚。近日有媒体通过邮件向NVIDIA提出了一些疑点问题,也让我们对新架构和新卡有了更多了解。

1、晶体管

NVIDIA公开的说法是30亿个,看起来只是个约数。有消息称确切的数字是32亿个,也有说30多亿个的。最终证实,就是30亿个

2、频率

GTX 480/470的核心频率分别是700MHz、607MHz,但GF100架构内的各个单元模块的实际运行频率并不完全一致。据解释,两个标称的核心频率代表了所有关键单元的速度,但Shader单元例外,GTX 480/470分别异步运行在1401MHz、1215MHz,而且也不包括显存界面,只是NVIDIA并未说清是仅限显存控制器还是包括连带的二级缓存和ROP单元。

3、载入和存储单元

每个流式多处理器(SM)之内有16个载入和存储单元,完整的GF100芯片一共256个,GTX 480/470分别是240个和224个。虽然看起来它们很适合纹理拾取,但NVIDIA表示载入和存储、纹理拾取的路径是不同的:载入和存储单元使用的是一级缓存、二级缓存、显存,纹理拾取路径则是纹理缓存(每个12KB)、三级缓存、显存。

4、共享存储器和一级缓存

我们知道,每个SM都有专用的64KB片上存储,可配置为48KB共享存储器加16KB一级高速缓存,或者16KB共享存储器加48KB一级高速缓存,那么默认的配置是什么?消息显示,在使用更频繁的图形模式中48KB配置为共享存储器,这取决于驱动编译器的图形内核的特点。

5、几何性能

NVIDIA宣称GF100的几何性能取得了突飞猛进,是GT200的八倍之多,那么这个比例是如何算出来的呢?GF100的曲面细分几何峰值速率是每时钟周期4个绘制三角形,但GT200并不支持曲面细分,所以很难直接比较。考虑到GT200频率和峰值三角形速率(每时钟周期0.5个绘制三角形而每时钟周期1个仅限实心三角形)都比较低,所以八倍应该是个合理的估计。

另外要注意的是,每时钟周期4个绘制三角形只是GF100的理论峰值性能,实际速度要看具体情况了,有消息称合理的实际速度最高是3.2个

6、双精度速率

虽然是基于同样的核心架构,但不同定位的产品在这方面差异很大。Tesla并行计算产品上,双精度速率是单精度的1/2,是个了不起的突破,不过GeForce消费级显卡上双精度速率被限制了很多,只有单精度的1/8。

7、像素填充率

NVIDIA只公布了GTX 480/470的纹理填充率,那么像素填充率呢?按照NVIDIA的说法,完整的Fermi/GF100核心每时钟周期可输出32个像素,以及256个Z轴采样(如果数据是可压缩的),但在具体产品上会随着GPC/SM的不同而有所差异,比如GTX 480只有15个SM(屏蔽了一组),每时钟周期的像素输出就是30个,GTX 470就是28个了。

GeForce GTX 480/470架构技术疑点解答
Fermi/GF100内核照片

分享到:
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏