四、Fermi架构解析
1、SP、SM
从高层次上看,Fermi和GT200结构形似,并无太大不同,但往身处看会发现绝大部分都已经进化。


最核心的流处理器(Streaming Processor/SP)现在不但数量大增,还有了个新名字CUDA核心(CUDA Core),由此即可看出NVIDIA的转型之意,不过我们暂时还是继续沿用流处理器的说法。
所有流处理器现在都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法,而后者在过去只是模拟的,事实上仅能计算24-bit整数乘法;同时引入的还有积和熔加运算(Fused Multiply-Add/FMA),每循环操作数单精度512个、单精度256个。所有一切都符合业界标准,计算结果不会产生意外偏差。
双精度浮点(FP64)性能大大提升,峰值执行率可以达到单精度浮点(FP32)的1/2,而过去只有1/8,AMD现在也不过1/5,比如Radeon HD 5870分别为单精度2.72TFlops、双精度544GFlops。由于最终核心频率未定,所以暂时还不清楚Fermi的具体浮点运算能力(双精度预计可达624GFlops)。

《LOL》第一位女性暗裔要来了?巴西老哥又爆猛料
黑五PS5优惠力度太大!限定机捆绑机卖脱销
《守望2》新女角色被批"身材太好"?设计师亲自回怼
TGA神秘骷髅雕像坐落现实!玩家实地打卡:急死了
情况有变!《霍格沃茨》新作或仍是单人RPG 联动HBO
擅长安慰寂寞少妇 曹操来了都说操的囧图