性能并非核心卖点,华为麒麟990 5G SoC的这些革新对行业意味着什么?

9月6日,华为在德国柏林正式发布了新一代旗舰SoC麒麟990系列,包括麒麟990和麒麟990 5G两款,后者是全球首款整合5G基带的旗舰SoC。在从4G向5G迈进的关键时刻,华为拿到了一个局点。对于华为手机来说,如何强调麒麟芯片的地位都不为过。事实上,正是麒麟芯片十年的厚积薄发,才让如今的华为手机有足够的底气应对各种挑战。

早在2009年,华为就推出了首款终端应用处理器K3V1,不过这款主供非主流厂商的芯片更像是一个Demo。真正的开山之作是2012年搭载于华为Ascend D上的K3V2,这是当时体积最小的一款高性能四核A9架构的处理器。K3V2谈不上成功,但是却让华为获得了非常宝贵的经验,并最终催生出了华为麒麟系列芯片。

从2014年初的麒麟910到2015年的麒麟935,华为不断地磨练自己在芯片方面的技术,以及芯片与终端之间的协同。之后,从2015年末的麒麟950开始,华为找到了芯片与终端之间最合适的协同方式,从而将芯片和终端市场的竞争带入自己的节奏。之后的麒麟960、麒麟970和麒麟980,都实现了领先竞争对手至少一个季度发布,并且能够第一时间推出终端产品。直到最新的麒麟990 5G SoC,让华为Mate 30成为首款整合5G基带的旗舰智能手机。

制程升级、核数增加,性能全面领先骁龙855

在5G之前,大家评判智能手机芯片能力的核心指标是性能,“不服跑个分”成了玩家的口头禅。虽然我们认为麒麟990 5G的最核心价值并非性能,但是CPU和GPU的性能依然是玩家关心甚至争论的焦点。

如果按照PC领域英特尔的CPU的Tick-Tock模式来划分的话,麒麟990 5G正处于Tick工艺升级阶段。相比麒麟980,麒麟990 5G的CPU架构并没有大的改动,两个大核和两个中核依然采用定制开发的ARM Cortex-A76,4个小核同样是ARM Cortex-A55。不过,其大核最高频率从2.6GHz提高到2.86GHz,小核频率从1.8GHz提高到1.95GHz。与高通骁龙855相比,单核性能提高了10%,多核性能提高了9%。GPU方面也依然采用的是Mali-G76,但是核心数量从麒麟980的10个提高到了16个。相比高通骁龙855,其图形性能提高了6%,能效提升20%。与竞争对手存在时间差的麒麟990 5G,至少在1个季度内可以保持住性能第一的位置。

目前关于麒麟990 5G的性能争论,主要集中在“为什么CPU没有采用更新的ARM Cortex-A77”。关于这个问题,余承东在接受媒体采访时已经给出了答案。这主要是出于能效平衡的考虑,麒麟990 5G提高了核心频率、增加了GPU核心的数量,原本会引起能耗的增加;不过在采用台积电最新的7nm+EUV工艺后,这部分能耗增加是可以得到控制的。

事实上,麒麟990 5G将能效管理提高到了一个非常高的优先级,因为在最近几年手机用户对发热、续航的态度越来越苛刻。特别是旗舰芯片,当年高通骁龙810的“火龙”表现给用户留下了深刻印象。麒麟990 5G在提高CPU核心频率的同时,针对不同大小的核心进行了功耗的精细调教。从官方公布的数据来看,大核能效相比竞争对手高12%,中核能效高35%,小核能效高15%。更高的能效,意味着在相同的功耗水平下,日常使用的体验可以更加流畅。

在GPU方面同样如此,麒麟990 5G的能效表现高出了20%。目前智能手机主要面对的高负载场景是游戏,因此控制游戏场景下的功耗可以显著改善续航表现。麒麟990 5G采用了全新的系统级Smart Cache分流技术,支持智能分配DDR数据,在重载游戏等大带宽场景下带宽相比上一代最高可节省15%,功耗可降低12%,进一步提升了GPU能效。同时,其支持Kirin Gaming+ 2.0解决方案,通过全新的AI调频调度技术实现GPU融合调度,结合游戏关联线程优化技术,动态感知性能瓶颈。通过对100万帧以上的游戏画面大数据进行学习,精准的Kirin Gaming+游戏性能功耗模型能够将性能功耗调度细化到游戏每一帧画面中,游戏帧率稳定在60帧,每帧负载调频准确性提升30%。

对比高通、三星、MTK,麒麟990才是整合5G真旗舰

麒麟990 5G的具体性能表现,相信等到9月19日正式发布后大家就可以一目了然。而在目前均处于芯片发布阶段的情况下,很多人认为麒麟990 5G落后于高通、三星甚至是MTK,因为从发布时间来看,三星和MTK均提前发布了自家的整合基带5G SoC。对于这个问题,我觉得可以分开来看。

先说高通,这是目前当之无愧的手机芯片领导厂商,除了苹果以外几乎所有手机厂商都在使用高通的SoC。不过正如我们在文章开头提到的,在麒麟950之前,高通确实算得上一枝独秀;不过从麒麟960开始,华为通过领先至少一个季度进入新产品周期的策略,获得了相对的竞争优势。在5G SoC的竞争上同样如此,华为整合5G基带的旗舰SoC麒麟990 5G已经正式发布,终端产品也将于本月上市;而高通虽然在年初PPT发布了第二代5G基带X55,但是旗舰级的8系列SoC并未整合该基带。高通首款整合5G基带的SoC将会是面向中端市场的7系列,今年第二季度才开始向手机厂商送样,真正的手机上市将会集中在年底。至于骁龙8系列的5G整合基带版本,不好意思,明年见!

与高通相同,希望在5G整合基带SoC领域抢跑以便获得先发优势的三星和MTK,同样采用了避重就轻的策略,首先推出的5G SoC均为中端型号,而非旗舰。

MTK在今年5月29日就官宣发布了首款5G整合基带SoC,当时给出的时间表是今年第三季度向手机厂商送样,首批手机产品要等到明年第一季度才会推出。不过我们除了知道这颗SoC将采用Helio M70基带、Cortex-A77架构CPU和Mali-G77 GPU、7nm工艺之外,其他信息至今尚未公布。而结合今年MTK憋出的大招Helio G90也只是一颗2(大核)+6(小核)、挑战骁龙730和麒麟810的中端芯片,估计我们明年能够看到的MTK 5G SoC也只是一颗7nm工艺架构升级版的中端芯片而已。

野心勃勃的三星其实在高端芯片领域还是有一定竞争力的。在很长一段时间里,Exynos猎户座芯片都是和高通旗舰芯片一起,作为三星旗舰机型Note系列和S系列的标配而存在的。因此,在9月4日三星选择抢跑华为发布自家5G集成基带SoC的时候,很多人还是很期待的。结果呢?期待三星5G旗舰SoC的玩家被闪断了腰。Exynos 980采用了8nm工艺,还是2(Cortex-A77大核)+6(Cortex-A55小核)的中端标配组合,大核最高频率仅为2.2GHz,GPU只有5个Mali-G76核心。

2+1的NPU组合,AI是麒麟990的核心竞争能力

这一波人工智能的振兴,可以追溯到2012年GPU技术进步为深度神经网络训练提供了更廉价的硬件基础。随后,深度学习和人工智能开始高速发展,语音识别、图像识别等技术的准确率开始超过人类,从而进入实用阶段。

我们作为普通人,最直接的感受就是智能音箱、手机智能助手等开始融入我们的生活。通过大型服务器训练出来的成熟AI模型被整合进终端设备,从而为我们的生活提供各种便利。不过,要让这些AI模型在本地以更高效率运行,同样需要足够的算力支持。因此,AI能力开始成为终端芯片的一个核心指标,并且伴随着人工智能技术的普及而变得越来越重要。

2017年发布的华为麒麟970芯片,成为智能手机行业拥抱人工智能的一个标志。麒麟970是“业界第一个真正意义上的手机AI处理器”,因为在它的内部除了常规的CPU、GPU、基带和ISP以外,还加入了专门的AI计算模块NPU(Neural Network Processing Unit,神经元网络)。

麒麟970是华为手机拥抱人工智能技术的开端,因此选择了联合寒武纪功能开发NPU模块,2018年发布的麒麟980也采用了这一模式。不过随着两代产品的铺垫,华为已经基本建立了基于移动终端的人工智能生态。随着HiAI生态2.0的推出,华为在AI应用方面开始进入厚积薄发的阶段。今年年中发布的麒麟810芯片,开始采用华为自研的达芬奇架构NPU,其AI算力甚至超过了作为旗舰芯片的高通骁龙855。

此次发布的麒麟990 5G是首款采用华为自研达芬奇架构NPU的旗舰级芯片,并且采用了双大核NPU+微核NPU计算架构,NPU大核用于高负载的人工智能计算,微核NPU则可以满足低功耗的人工智能应用需求。在双大核NPU的加持下,麒麟990 5G拥有目前手机芯片最强AI算力,最新的AI Benchmark成绩排名中,麒麟990 5G的得分高达76204,是麒麟810(35130)和高通骁龙855 Plus的(32727)的两倍以上。无论是在业界典型的中载神经网络模型ResNet50(用于检测、分割和识别),还是在移动端更流行的轻载神经网络模型MobilenetV1(用于分类、检测、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均达到了行业最佳水平。

大幅提升的人工智能计算能力,意味着基于麒麟990 5G可以实现很多过去难以想象的应用。比如华为在现场演示的AI多人实时换背景功能,通过先进的AI多实例分割技术,能够将视频画面中的每一个人物主体单独识别并与背景分离。在此基础上,无论是替换视频背景还是删除特定人物,甚至是改变不同人物的前后位置,都可以高效快速的在智能手机上完成。还有基于人工智能计算的视频超分技术,可以将老旧设备拍摄的视频画质提升到高清水平。

AI为核、5G为翼,麒麟990重构智能终端行业未来

对于麒麟990 5G这颗芯片,我们认为决不能将它看作一个普通的手机SoC升级,而是着眼于改变终端生态的一次变革。麒麟芯片的发展经历了三个阶段:第一个阶段主要优化计算模块的设计,比如CPU和GPU架构的选择和调优;第二个阶段主要是ISP的设计,华为在欧洲设立研发中心的效果开始显现,如今拍照效果排名全球第一离不开自有ISP的贡献;第三个阶段则是人工智能模块的设计,从最初采用寒武纪,到如今自有的达芬奇架构,麒麟芯片在AI能力方面实现了领先。

麒麟芯片不同的发展阶段,对应的是个人智能终端的不同应用需求。早期的智能手机,更强调数据处理,是个人电脑与手机的结合体,或者说是带通讯功能的PDA,因此CPU和GPU的计算能力非常关键。但是随着整合摄像头的画质不断提升,智能手机开始取代普通卡片相机,成为用户拍摄个人照片的主要工具,此时能够实现更好、更快图像处理的ISP变得非常重要。而到现在,智能手机所要面对的需求变得更加复杂,甚至开始化身个人智能助手。此时,终端对人工智能计算能力的需求开始变得越来越迫切。

不过要注意的是,这种需求绝不是简单的浮点和整数计算能力,而是要有一个可以通用、便于迁移的计算架构,方便开发者针对性地开发人工智能模型。专业的事情交给专业的人去做,才能更有效率;使用专门的NPU而非普通CPU和GPU来进行人工智能运算,才能实现更高的性能。华为在2018年推出了全新的自研AI计算架构达芬奇,就具备灵活可裁剪的特性,可以满足小到几十毫瓦、大到几百瓦的广泛应用场景。此次麒麟990 5G内部搭载的NPU大核和NPU微核,其实就是基于达芬奇架构的不同尺寸核心,其中NPU微核(Ascend Tiny)在人脸识别的应用场景下,能效水平比大核(Ascend Lite)提升了24倍。再结合同时建立与云、端、芯上的华为HiAI Foundation能力,开发者能够提供更加丰富的、基于达芬奇架构的AI应用。

2G时代激活了文本,3G时代激活了图片、4G时代激活了视频,5G时代将会开拓出怎样的内容类型呢?未来,一切皆有可能,AI为核、5G为翼的麒麟990,正在重构智能终端行业的未来。实现AI和5G完美融合的麒麟990 5G,无疑将成为新时代人工智能终端的基石,帮助我们探索AI+5G应用的无限可能。