游民星空 > 新闻中心 > 正文

NVIDIA Fermi(GT300)通用计算架构探秘 样卡展示

2009-10-01 14:30:13 来源:来源:驱动之家 作者:佚名 编辑:dsgames568 浏览:loading

四、Fermi架构解析

1、SP、SM

从高层次上看,Fermi和GT200结构形似,并无太大不同,但往身处看会发现绝大部分都已经进化。

NVIDIA Fermi(GT300)通用计算架构探秘 样卡展示

NVIDIA Fermi(GT300)通用计算架构探秘 样卡展示

最核心的流处理器(Streaming Processor/SP)现在不但数量大增,还有了个新名字CUDA核心(CUDA Core),由此即可看出NVIDIA的转型之意,不过我们暂时还是继续沿用流处理器的说法。

所有流处理器现在都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法,而后者在过去只是模拟的,事实上仅能计算24-bit整数乘法;同时引入的还有积和熔加运算(Fused Multiply-Add/FMA),每循环操作数单精度512个、单精度256个。所有一切都符合业界标准,计算结果不会产生意外偏差。

双精度浮点(FP64)性能大大提升,峰值执行率可以达到单精度浮点(FP32)的1/2,而过去只有1/8,AMD现在也不过1/5,比如Radeon HD 5870分别为单精度2.72TFlops、双精度544GFlops。由于最终核心频率未定,所以暂时还不清楚Fermi的具体浮点运算能力(双精度预计可达624GFlops)。

NVIDIA Fermi(GT300)通用计算架构探秘 样卡展示

NVIDIA Fermi(GT300)通用计算架构探秘 样卡展示

上一页 1 2 3 4 5 6 7 下一页
友情提示:支持键盘左右键“← →”翻页
分享到:
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏