Nvidia 今天上午正式发布 GeForce RTX 2070 显卡,采用 TU106 架构,内建 3 个图灵图形处理集群(或 GPC),每个集群有 12 个流式多处理器(SM),总共 36 个图形处理 ” 核心 “。这些 SM 中的每一个都具有 64 个着色器 ALU 或 CUDA” 核心 “,总共 2304 个核心。 TU106 具有 144 个纹理单元,64 个 ROP 和一个 256 位总线,以 8 GB GDDR6 显存,速度为 14 Gbps。
RTX 2070 的二级缓存是 GTX 1070 的两倍,达到 4 MB,其寄存器文件的总大小(分布在每个 SM 中)已经膨胀到 9.216 MB,而 GTX 1070 则为 3.840 MB,为执行单元提供更多数据是提高性能的一种可靠方法,与其 Pascal 前身相比,TU106 的片上高速缓存在这方面肯定可以获得更大的提升。
与其较大的图灵兄弟一样,RTX 2070 还具有一些专门用于加速某些光线追踪操作的资源。 RTX 2070 具有 288 个图灵 Tensor 核心(每个 SM 8 个)和 36 个图灵 RT 核心(每个 SM 一个)。相比之下,为 RTX 2080 有 368 个 Tensor 核心和 46 个 RT 核心,RTX 2080 Ti 有 544 个 Tensor 核心和 68 个 RT 核心。
由于我们还没有任何使用这些处理资源的实际应用程序,因此很难说 RTX 2070 的光线追踪性能究竟如何,对于它的价值,Nvidia 表示 RTX 2070 Founders Edition 可以执行 45 个 RTX tera-OPS(用 Turing GPU 进行混合渲染的性能潜力测量),而 RTX 2080 FE 为 60,RTX 2080 Ti FE 为 78。
由于 RTX 2070 是采用 TSMC 的 12-nm FFN 工艺制造的,因此其 108 亿个晶体管与用于制造 Pascal 的 16-nm FinFET 工艺相比,不会受益于面积收缩(如果有的话)。因此,TU106 芯片为 445mm ?,相比之下,为 GTX 1070 和 GTX 1080 采用的 GP104 芯片面积为 314mm ?,RTX2070 显卡公版功耗规格为 175 W 和 ” 工厂超频 ” 创始人版功耗 185 瓦。
从 25 个游戏和综合基准测中,Nvidia 测试实验室预计,与 GTX 1070 相比,RTX 2070 在 2560×1440 SDR 游戏中的性能将提高 33%,而 HDR 游戏提高 35%。该公司建议合作伙伴 RTX 2070 显卡起价 499 美元。