现在的显卡具有多级缓存结构,这些级别的缓存经过精心设计,可填补计算间的空白,对GPU的性能与速度有着重要影响。不同的GPU供应商(例如AMD和NVIDIA)具有不同大小的L1和L2缓存。例如,NVIDIA A100 GPU上的L2缓存为40MB,这是上一代GPU L2缓存量的七倍,这表明有许多新的应用程序比以前更吃缓存了。
TDP消息,国外一网站测试了最新一代显卡(AMD的RDNA 2和NVIDIA的Ampere)的GPU显存延迟。通过在OpenCL中使用指针追逐测试,可得出以下结论:RDNA 2的高速缓存非常快速,与Ampere相比,缓存延迟要低得多,而VRAM延迟几乎是相同的;NVIDIA使用由L1和L2组成的两级缓存系统,速度相对较慢,数据从拥有L1缓存的Ampere SM簇传输到外部L2的需要100ns左右的延迟。
AMD具有三级缓存系统,L1和L2之间的延迟只有66ns。Infinity Cache本质上是L3缓存,仅增加了20ns的额外延迟,与NVIDIA的缓存解决方案相比,AMD更具优势。
知名人士爆猛料!《生化危机》初代重制经典归来?
《忍龙4》DLC今日上线:超帅巨镰战斗拉满!
十几家工作室抢着做?《血源RE》内幕还有新料!
《宝可梦:火红/叶绿》测评:情怀热烈 质量一般!
里昂个人秀!爆料称《生化9》DLC已接近完成
干点成年人该干的 从99%腿控变100%臀控的囧图