下边简单讲讲全新架构GCN。
GCN架构的关键之处就在于并行计算的进化,从最最初的固顶功能到后来的简单着色器编程,直到现代的图形并行核心,而且后者还在A卡上经历了VLIW5、VLIW4、GCN三种方案。其实由此也可以看出,VLIW4就是个试验性质的过渡方案。
GCN架构的特性很早以前就详细解读过,这里简单看看AMD列出的几个要点:
- 顶级的图形性能、特性——这还是显卡的根本所在
- 高计算密度与多任务——并行计算就看它了
- 专注于高能效——也感谢新工艺
- 优化异构计算——这自然是AMD最迫切希望做好的
- 实现融合系统架构(FSA) ——不然买ATI干啥
- 惊人的扩展性和弹性——方便开发人员的,以往AMD在这方面确实有很大不足
Radeon HD 7900系列的流处理器被分成了最多32个计算单元(Compute Unit),每个单元内有64个流处理器,同时搭配两个几何引擎和八个渲染后端,拥有最多32个色彩ROP单元和128个Z-Stencil ROP单元。
针对并行计算,Radeon HD 7900核心内特别安排了多达768KB的二级缓存,而且支持读取、写入,还有其它各种缓存。这里是非常消耗晶体管和核心面积的,所以晶体管总量才达到了恐怖的43亿个。核心面积仍然无从知晓,但感谢28nm,看起来应该会比Cayman Radeon HD 6900还小一些。