众所周知,制造工艺一直是图形处理器GPU乃至其它所有半导体增强性能或控制成本的最关键因素,ATI深知这一点的重要性,也一直在最近一段时间内在这方面领先竞争对手。RV740是ATI首款基于40nm工艺的图形核心,虽然这款核心在上市之初遇到了产能不足的困难,但这些经验为今天Radeon HD 5850显卡的诞生提供了最直接的受益。RV870的流处理器单元从800个激增到1440个而核心面积却没有大幅度增加(核心架构还有其它改进),就主要来源于先进的工艺。
同时,ATI目前已经被AMD公司所收购,那么GPU的设计是否可以考虑融入一些CPU的概念呢?尤其是双核心、四核心CPU大行其道的今天,GPU是否也可以引荐一下AMD在CPU方面的成功经验?我们接下来就看看此次RV870的核心设计,下图就是RV870的核心逻辑架构图:
相比HD5870,HD5850省略两组SIMD阵列
如果了解CPU架构的朋友,在看到HD5850核心逻辑架构图后应该会感到些许眼熟。在核心当中,我们可以看到两组SIMD阵列呈对称型排列,其中每组阵列当中均有720个流处理单元设计(在单一SIMD引擎当中,ATI采用的排列方式依然是RV770的设计方式。也就是说,每个SIMD阵列当中包含9组SIMD阵列,而每个SIMD阵列当中又包含16个流处理器,每个流处理器包含5个流处理单元,所以流处理器单元也就等于18x16x5=1440个)。
如果仅仅从架构图上来分析,我们似乎看到了一款双核处理器的影子,就好象两个RV770核心相对放置一样,这的确是增加性能一个最为快速的方式,当然,ATI绝对不会简单将两个RV770核心对置那么简单,如果仔细查看还能够发现,在图形引擎当中的Hierarchical Z以及Rasterizer部分也设计了双份,而在Hierarchical Z末端连接的Z/Stencil也增加了一倍,达到128个,而ATI显卡常见的Render Back-Ends后端渲染也翻了一番。
另外,在架构图的右下角部分,我们可以看到一个名为“EyeFinity Display Controllers”的模块,没错,这里就是负责让显卡实现6屏幕输出的关键部分了。
接下来,我们将HD5850的核心架构分解成多个部分,为大家一一进行解释。