很突兀,NVIDIA CEO黄仁勋在上周末发布了新一代旗舰级“泰坦”显卡——GTX TITAN V,其后缀“V”应该是标识它基于全新的伏特(Volta)架构。
我可以想象它比当前的旗舰更强,但绝对料不到能强到“封神”,一些媒体已经将它神话,宣传理论计算性能大约是上代旗舰的10被!(传说浮点运算能力高达110TFLOPs,但我可以负责的告诉你,其实是15TFLOPs)
好吧,玩PC超过10年,芯片换代性能翻番已难得,但并非没有过,但飞升10倍却绝对让人震惊,难道NVIDIA掌握了什么外星黑科技?于是赶紧联系厂家了解详细情况,一番分析下来,我敢肯定的是,一些媒体兴奋过头了,NVIDIA此番能如此快推出新架构,是因为它们偷懒了,而不是掌握了黑科技!
GTX TITAN V采用12nm工艺,比之前Pascal架构的GTX 1080Ti等显卡使用的16nm工艺更先进。这通常也意味着更高的晶体管密度和更出色的能耗比。
但根据此前的爆料,台积电这个所谓的全新12nm工艺和GlobalFoundries等厂的12nm FD-SOI工艺不同,它看起来并非一个完整的跨代升级版本。有分析者笑称这个12nm是此前16nm工艺的马甲,因为这其实是台积电16nm工艺的第四个缩微改进版本,经过改良后,它具有更低的漏电率和成本优势,并且晶体管线宽已经领先三星的所谓14nm工艺。为了配合三星的数字游戏,彰显自己工艺的优势,台积电改称它为12nm。
这个工艺并非真正的劝解缩放式升级,但依旧具有不错的改良效果。至少从成品GTX TITAN V上看,它成功完成了211亿超大核心的代工任务(当然,这个数据很可能是因为包含了HBM片上12GB显存的原因)。但无论如何,这个数据也远远超过了上代GTX TITAN XP核心120亿晶体管的规模。
规格的提高自然带来性能的增长,国内目前还没有拿到测试卡,不过好在国外已经有达人公布了一些测试成绩。从测试来看,它的游戏表现有些对不起自己的硬件规模。它的计算单元比GTX 1080Ti多出了40%以上,显存带宽也更是高出了35%左右。但是实际游戏成绩多数时候领先也就25%左右,甚至更低。
GTX TITAN V计算单元是足够多,但是核心频率相应降低。简单类比,你会发现5120(TITAN V计算单元)*1200(TITAN V核心频率)恰好比3584(1080Ti计算单元)*1481(1080Ti核心频率)强出25%左右的计算能力,也就是说具体到单个流处理器上,两代架构的同频性能是一样的。
这让我有理由相信此前坊间的一种推测:
“由于竞争压力小(主要指AMD显卡不给力),所以NVIDIA并不急于拿出更多的技术储备来更新显卡。新的Volta架构主要做了深度学习等AI计算、专业计算方面的强化升级,游戏计算上和上代帕斯卡架构没有太大区别,你可以理解为堆核心数量的马甲设计。“
很明显,从这个角度看NVIDIA显然在流处理器设计上偷懒了,目前的设计针对游戏计算不可能已经达到没有改进空间的水平。但是游戏显卡增长的乏力,以及专业领域更加丰厚的利润是诱惑NVIDIA偏心强化“最大浮点运算“能力的诱因。
也是这个“最大“导致了一些媒体的误导性解读,在此我跟大家解释下为何15TFLOPs会被一些媒体解读为110TFLOPs(传说中的双卡顶超算)?
其实此处的110TFLOPs是单纯的指深度学习计算能力,因为NVIDIA在努力转型为一家专注于AI计算的公司,但AI计算经常使用的深度学习模型对计算器的要求并不高,需要的是量大。所以传统浮点计算中的64位双精度、32位单精度其实没什么意义。
因此他们从帕斯卡架构开始就开始专注优化半精度,即FP16,Volta架构更进一步细化到FP8(可以简单理解为1/4精度),也就是NVIDIA宣称的革命性的Tensor运算单元设计,效率极高还非常省电。也正因为此,加上传统的浮点单元,最终造就了TITAN V AI浮点“最高“110 TFLOPs的传说。
所以想要靠堆TITAN V实现动辄FP32性能200~300TFLOPs的超算机,至少要是十几张卡并联。当然,这么多卡并联是不可能的,NVIDIA官方允许的最多只能2路并联。而且两卡并联的桥接器单价高达500多美元,你没看错!单桥接器价格就是此前半张旗舰卡了……
虽说TITAN系列的定位很特殊,可以用来专业应用,也可以是顶级游戏卡,但是很明显,Volta架构的TITAN V从价格设计之初就更进一步偏向专业化了,玩游戏更像是兼职了……
我相信多数玩家肯定是不满意的,价格比之前的GTX TITAN XP翻倍还多,比4路GTX 1080Ti还贵!但游戏性能只比单张GTX 1080Ti提升25%左右,这信仰充不充值?或者是期待更偏向游戏的GTX 2080Ti(猜想型号)?