AMD没有选择在CES 2014上发布下一代APU Kaveri,而仅仅是召开了一个内部技术会议,正式发布还要等到14日,不过,AMD还是允许媒体放出一部分信息,让大家预览、期待一下。
如之前所述,Kaveri是真正的第三代APU,生产工艺进化至28nm,CPU架构升级至压路机,GPU架构升级至GCN,而且支持异构计算、统一寻址。如果说之前的Llano、Trinity、Richland都是在给AMD的融合大业铺路,Kaveri就是实现这一宏伟目标的最关键一步。
按照官方说法,Kaveri APU的亮点主要有四个方面:
1、重新设计的计算核心
压路机架构是推土机家族的第三版,进一步改进了性能和功耗,并且首次搭配28nm工艺。AMD宣称,压路机的IPC(每时钟周期指令)在同频率下可比打桩机提升多达20%。
Kaveri将集成最多512个流处理器,而且这次终于是GCN架构了。这些流处理器分为八个执行单元,再加上四个CPU核心,AMD称它们是“12个计算核心(compute core)”,总的浮点性能为856GFlops。
这种说法并不是为了好看,而是技术上的(纯粹为了看上去更漂亮完全可以说516个计算核心)。AMD表示,计算核心就是一个支持HSA(异构系统架构)的硬件模块,可以是CPU、GPU也可以是其它处理单元,都是可编程的,能够在自己独立的环境和虚拟内存空间内处理至少一个线程,并且与其它计算核心相独立。
这就意味着,如果使用Kaveri APU去运行异步内核,那就可以同时跑最多12个。
2、异构计算、统一寻址
Kaveri将第一次真正实现异构系统架构(HSA)、统一内存寻址,CPU、GPU真正融为一体。
AMD最初提出异构概念的时候,缺乏足够的生态系统支持,而现在Windows 8/8.1已经原生支持HSA,剩下的就是程序员编程了,而且不仅如此,AMD还奉上了两大利器:
- hUMA:Heterogeneous Unified Memory Access,异构统一内存访问。不管是什么内存类型(DDR3/DDR4/GDDR5),APU中的CPU、GPU模块都可以在任何时间、任何位置访问全部内存空间,而且是彼此共享的,完全零拷贝。
- hQ:Heterogeneous Queuing,异构队列。这个是CPU、GPU内部的沟通桥梁,用于彼此直接交换计算任务,无需绕过其它第三方总线。
有了它们,程序员就可以随时呼叫最多12个计算核心同时运作,并且大大简化对内存对访问和使用,以及CPU/GPU之间的交流,效率自然可以明显提升。
AMD举例说,LibreOffice Calc(相当于Office Excel)执行某项任务的时候,通常情况下需要0.99秒钟,而在HSA架构下只需0.12秒钟,效率提升了8倍多!
3、游戏技术
Kaveri APU继承了GCN架构显卡的诸多游戏技术,尤其是PCI-E 3.0、Mantle、TrueAudio,都是原汁原味的。
当然了,后两项还在发展初期,仍然需要游戏的鼎力支持才行。