GCN 2.0架构解析:全方位的增强二
渲染后端最多16个,也就是64个ROP。二级缓存容量也扩充至1MB,依然可读可写,还能划分为最多16个分区。
显存位宽重归512-bit,即便等效频率降至5GHz,带宽也提升到了320GB/s。最关键的是,高位宽显存控制器需要大量核心面积已经成为历史,综合各方面改进这次反而要比之前的384-bit在面积上小了大约20%,因此单位面积带宽增加了50%。
异步计算引擎从两个猛增至八个,还有两个DMA引擎。
GCN 1.0/2.0效率对比:24%的额外面积带来了20-90%的性能提升。