老架构上的大核心:GeForce Titan规格详解
基于Kepler架构,GeForce Titan使用的GK110核心简单来说就是一颗增强放大版的GK104。从核心架构图来看,同样包含主接口(Host Interface,PCI-E 3.0)、GigaThread引擎,每个SMX内有192个FP32 CUDA核心(另有64个F64 CUDA核心),64KB一级缓存、65K个32bit寄存器以及16个纹理单元。图形处理器集群(GPC)增加到5个,每个GPC包含3组极致流式多处理器(SMX)、2个PolyMorph 2.0引擎、1个Raster引擎、8个ROP以及连接1组64bit GDDR5显存控制器。(鉴于Kepler架构我们在GTX 680首发时已做了深入介绍,这里就不再赘述了,感兴趣的读者可参看之前的文章。)
需要指出的是,GeForce Titan并没有完全开启GK110的15组SMX,而是屏蔽了1组,其它部分没有削减(至于为何要屏蔽1组SMX,NVIDA并没有给出解释,功耗?发热?Who Knows)。总得来说就是共计2688个FP32 CUDA核心(896个FP64 CUDA核心)、224个纹理单元、48个ROP、1536KB二级缓存、384bit GDDR5显存位宽,6GB GDDR 5显存。怎么样,是不是很眼熟?这不就是之前Tesla K20X的翻版,也难怪AMD觉得GeForce Titan不是真正意义上的桌面显卡。
而核心规模上,GK110也是相当庞大,晶体管数量达到了恐怖的71亿(要知道这是单核心啊),即便使用了28nm工艺,核心面依然达到了551mm2,这几乎相当于GTX 680(GK104、294mm2)的两倍,比GTX 580(GF110、520mm2)还要稍大一些。而NVIDIA给出的一张对比图也相当有趣,对象成了Intel i7 3860 X处理器,无论是核心处理、单精度计算性能,还是晶体管规模,GK110都是“完胜”。或许在NVIDIA看来,GeForce Titan已经“不屑于”和GPU对比了。
从标识来看,GeForce Titan核心编号为“GK100-400-A1”,生产日期是2012年第50周(年底了),如果算上PCB以及整卡的封装时间,应该就是前不久刚刚出场的,可谓“新鲜出炉”。
在71亿晶体管、551mm2的数据面前,恐怕不会有人觉得GeForce Titan还能预设高频率了吧。但是,NVIDIA却给了我们一个小小的惊喜,837MHz的基础核心频率相比GTX 680虽然不算太高,但和GTX 580的772MHz、GTX 590的607MHz已经高了太多。而且,典型Boost频率为876MHz(最高可到992MHz),这无疑又给Titan的性能添砖加瓦。
显存配置方面,GeForce Titan依然使用了等效频率为6000MHz的GDDR 5显存,但是容量由GTX 680的2GB增加到6GB(提高3倍),带宽由192GB/s提升到288GB/s(提高50%)。毫无疑问,在面对高分辨率高画质游戏的时候,GeForce Titan将占据绝对优势。
此外,GeForce Titan的计算性能相比GTX 680有了长足进步,浮点性能达到了单精度FP32 4.5TFlops、双精度FP64 1.3TFlops(3:1)。相比之下,GTX 680只有单精度FP32 3.09TFlops、双精度FP64 0.13TFlops。
至于功耗方面,GeForce Titan毫无疑问将比GTX 680增加不少——由195W提高到250W(但比GTX 690低50W),外接供电接口也由双6pin变成6+8pin。输出接口上,依然采用2xDual Link DVI+HDMI+DP 1.2的组合,同样具备GTX 680的单芯三屏3D立体幻镜环绕功能。
特性上,GeForce Titan支持PCI-E 3.0、DirectX 11.1、Shader Model 5.0、OpenGL 4.3以及Open CL 1.2,均为业界最新标准。
和往常一样,NVIDIA直到下午才给出GeForce Titan的国外、国内建议售价。最终结果和我们之前猜测的大致相同:999美元/7999元,虽然很贵,但和要价14888元的华硕ARES II战神卡相比,就小巫见大巫了。
GTX Titan |
GTX 690 |
GTX 680 |
GTX 580 | |
核心代号 |
GK110 |
GK104x2 |
GK104 |
GF110 |
核心架构 |
Kepler |
Kepler |
Kepler |
Fermi 2.0 |
CUDA核心 |
2688 |
2 x 1536 |
1536 |
512 |
纹理单元 |
224 |
2 x 128 |
128 |
64 |
ROPs |
48 |
2 x 32 |
32 |
48 |
核心频率 |
837MHz |
915MHz |
1006MHz |
772MHz |
Shader频率 |
N/A |
N/A |
N/A |
1544MHz |
Boost频率 |
876Mhz |
1019MHz |
1058MHz |
N/A |
显存频率 |
6.008GHz GDDR5 |
6.008GHz GDDR5 |
6.008GHz GDDR5 |
4.008GHz GDDR5 |
显存位宽 |
384-bit |
2 x 256-bit |
256-bit |
384-bit |
显存容量 |
6 |
2 x 2GB |
2GB |
1.5GB |
FP64 |
1/3 FP32 |
1/24 FP32 |
1/24 FP32 |
1/8 FP32 |
TDP |
250W |
300W |
195W |
244W |
晶体管数量 |
7.1B |
2 x 3.5B |
3.5B |
3B |
制造工艺 |
TSMC 28nm |
TSMC 28nm |
TSMC 28nm |
TSMC 40nm |
核心面积 |
551mm2 |
294x2mm2 |
294mm2 |
520mm2 |
首发定价 |
$999 |
$999 |
$499 |
$499 |