GTX1660Ti性能游民首测 比肩GTX1070的图灵新花

2019-02-22 22:01:26 来源:游民星空[原创] 作者:尹晓峰 编辑:Firebird 浏览:loading

  重制SM单元的TU116核心

游民星空

  60级显卡一直是“甜点”的代名词,而这款为GTX1060 6G的接棒者设计的核心,更是在性能、功耗与成本上做了更为精细得平衡。

  TU116由3个GPC构成,与RTX2060的TU-106-200核心相比每组GPC少了一组TPC,一共有12组TPC与24组SM,TU116中集成了66亿晶体管,拥有1536个流处理单元、48个ROPs单元与96个纹理单元,并没有集成RT Core与Tensor Core的SM单元也代表着GTX1660Ti无缘对光追踪与DLSS超采样技术的支持。

游民星空

  NVIDIA的工程师对TU116核心的SM做了一些小改动,如上图所示,SM被划分为四个处理块,每个处理块具有16个FP32核、16个INT32核、一个调度器和一个调度单元,原本为DLSS服务的两个Tensor核被替换成32个FP16核。每个块包括一个L0指令缓存和一个64KB寄存器文件。四个处理块共享组合的96KB L1数据高速缓存/共享存储器。

游民星空

  传统的图形工作负载将96KB L1共享缓存划分为64KB的专用图形着色器缓存以及32KB的纹理缓存和寄存器溢出区域。计算工作负载可以将96KB分成32KB共享缓存+64KB L1缓存,或者64KB共享缓存+32KB L1缓存。

游民星空

  与Pascal架构相比,图灵架构实现了核心执行数据通道的主要更新,就以《古墓丽影:暗影》为例,其中每100条指令中,平均62条浮点运算与38条整数运算指令,而Pascal显卡在面对这些运算指令时,每当非FP数学指令中的一个运行时,ATAPACH就会闲置。但Turing在每个CUDA核旁边添加第二个并行执行单元,该CUDA核与浮点数学并行执行这些指令,这也使得在《古墓丽影:暗影》中GTX1660Ti拥有相较于GTX1060 6G约1.5倍的性能提升。

上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
友情提示:支持键盘左右键“← →”翻页
人喜欢
游民星空APP
随时掌握游戏情报
code
休闲娱乐
综合热点资讯
单机游戏下载
好物推荐
游民星空联运游戏