2019年11月29日,华为与鹏城实验室在深圳共同发布鹏城云脑II一期,正式开启千 P 级 AI 集群应用,这是鲲鹏计算产业在科研领域的重大进展。搭载鲲鹏、昇腾处理器的华为 Atlas 900 AI集群作为鹏城云脑II的底座,为鹏城云脑II注入澎湃算力,支撑 AI 领域诸如计算机视觉、自然语言、自动驾驶、智慧交通、智慧医疗等各类基础性研究与探索。鹏城云脑目前算力为100P FLOPS,明年将迈入千 P 级算力规模。鹏城实验室主任高文,鹏城实验室常务副主任邹鹏,华为高级副总裁、Cloud & AI 产品与服务总裁侯金龙,华为 Cloud & AI产品与服务 CTO 张顺茂,华为智能计算业务部总裁马海旭等一行出席了发布会。
华为高级副总裁、Cloud & AI 产品与服务总裁侯金龙表示:“华为在今年9月围绕‘鲲鹏+昇腾’双引擎全面启航计算战略,致力于为世界提供最强算力,并发布了全球训练最快的 AI 集群 Atlas 900。今天华为 Atlas 900集群系统正式入驻鹏城云脑Ⅱ,为鹏城云脑II提供坚实的底座。鹏城云脑II是业界领先的 AI 研究平台,鹏城实验室汇聚了大批院士与优秀 AI 研究人才,秉承双方共建鹏城云脑II的理念,华为与鹏城实验室携手共同探索智能世界的未来方向、共同研究智能世界的难题。现在建设的是鹏城云脑II一期,相信在各方共同努力下,千 P 级的鹏城云脑II将指日可待,我们有信心把鹏城云脑II打造成全球持续领先的 AI 研究平台。”
华为智能计算业务部总裁马海旭表示:“华为 Atlas 人工智能计算平台基于华为昇腾系列 AI 处理器,通过模块、板卡、小站、AI 服务器、集群等丰富的产品形态,打造面向‘端、边、云’的全场景AI基础设施方案,覆盖深度学习领域推理和训练全流程。Atlas 900作为 Atlas 系列的旗舰产品,代表了当今全球 AI 计算的领先水平,我们希望通过 Atlas 900与鹏城云脑II的合作,共同建设千 P 级 AI 集群应用,为业界提供充沛的算力,加速全行业智能化升级。”
鹏城云脑是人工智能领域的大型信息类重大科技设施,是探索人工智能奥秘和打造人工智能先进技术的基础性研究平台,现有 AI 算力100P FLOPS。明年,鹏城云脑II将达到千 P 级 AI 算力规模,成为领先的 AI 研究平台。鹏城云脑II由鹏城实验室和华为共同建设,搭载鲲鹏、昇腾处理器的Atlas 900集群提供充沛算力,鹏城实验室研发千 P 级云脑关键技术。
华为 AI 集群 Atlas 900汇聚了华为十余年的技术沉淀,由数千颗昇腾910 AI 处理器组成。在衡量 AI 计算能力的标准 ResNet-50图片分类模型下,Atlas 900只需59.8秒就完成了训练,在同等精度下比原世界纪录快10秒。Atlas 900凭借其强大算力,可广泛应用于科学研究与技术创新,比如天文探索、气象预测、自动驾驶、石油勘探等领域。Atlas 900拥有以下几大创新特性:
- 强劲算力:数千颗昇腾910 AI 处理器互联,半精度(FP16)算力达256-1024 PFLOPS,相当于50万台 PC 机的算力;采用 SoC 设计,整合了 AI 算力、通用算力和 I/O,有效提升训练效率。
- 高速集群网络:采用 HCCS、PCIe 4.0、100G 以太三类高速互联方式,梯度同步时延缩短10%~70%;独创 iLossless 智能无损交换算法,对全网流量进行实时的学习训练,实现网络零丢包与端到端微秒级时延。
- 高效散热:采用柜级绝热密闭系统,液冷占比可大于95%,系统能效比小于1.1。
截至目前,基于昇腾910和310 AI 处理器,华为推出了 Atlas 900 AI集群、Atlas 800 AI服务器、Atlas 500 智能小站、Atlas 300 AI 加速卡和 Atlas 200 AI加速模块,完成了 Atlas 全系列产品布局,覆盖云、边、端全场景,面向训练和推理提供强劲算力。
未来,华为将面向鲲鹏计算产业,持续加大在处理器、操作系统、数据库等基础设施上的投入与创新,为鹏城云脑提供源源不断的 AI 算力,携手鹏城实验室共同促进 AI 技术的进一步发展以及在社会经济各领域的广泛应用与实践。