写点什么

华为发布全球最快 AI 训练集群 Atlas 900

  • 2019-09-18
  • 本文字数:2145 字

    阅读完需:约 7 分钟

华为发布全球最快AI训练集群Atlas 900

北京时间 9 月 18 日,2019 华为全联接大会在上海开幕,InfoQ 作为受邀媒体对本次大会进行报道。本次大会上,华为副董事长胡厚崑不仅完整展示了华为在智能计算时代的发展战略,同时还重磅发布了一款全球最快的 AI 训练集群:Atlas 900。

Atlas 900:全球最快的 AI 训练集群

在 2019 华为全联接大会的现场,华为副董事长胡厚崑正式发布了 Atlas 900。据了解,Atlas 900 是当前全球最快的 AI 训练集群,它由数千颗昇腾 910 AI 处理器构成。Atlas 900 通过华为集群通信库和作业调度平台,整合 HCCS、 PCIe 4.0 和 100G RoCE 三种高速接口,充分释放昇腾 910 的强大性能。其总算力达到 256-1014 FLOPS @FP16,相当于 50 万台 PC 的计算能力。



当前华为已在华为云上部署一个 Atlas 900 集群,只需 59.8 秒就可以完成典型网络的训练,比第二名快了 10 秒。对此胡厚崑做了一个形象的比喻:这相当于第一名出线以后,喝了一瓶水,第二名才出线。本次测试基于“ResNet-50 v1.5 模型”和“ ImageNet-1k 数据集”。



除了基础硬件,华为基于 Atlas 900 还提供华为云 EI 集群服务,采用从底层硬件到开发架构的全栈优化,提供世界顶级的强劲算力。


据了解,Atlas 900 可广泛应用于科学研究与商业创新,让研究人员更快的进行图像、语音等 AI 模型训练,让人类更高效的探索宇宙奥秘、预测天气、勘探石油,加速自动驾驶的商用进程。

华为披露智能计算全战略

两年前,华为发布了新的愿景使命,就是要“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。每年的华为全联接大会都是华为的一次答辩会,这次大会现场胡厚崑首次披露了华为的智能计算全战略。


华为认为智能世界有三个特征,就是万物感知、万物互联、万物智能,要支撑这样一个智能世界,有两个关键的技术需要持续创新和投资:联接和计算。联接和计算是一对孪生兄弟,在当今的世界里,哪里有联接,哪里就有计算。反之亦然。胡厚崑谈到,过去华为对联接谈得比较多,但其实华为对计算的投资已有十年,今天重点向大家分享一下华为在计算方面的洞察与战略。

对计算产业的观察

  • 计算成为人类能力的延伸:70 多年的发展,计算机体积越来越小,性能越来越强,人机距离越来越近,已经成为人类能力的一种延伸;

  • 计算模式不断演进:从基于规则到基于统计,解决了许多 AI 问题;

  • 计算进入智能时代:超强算力、计算无处不在、端边云协同,将是智能时代的三大特征。


胡厚崑表示,基于 Gartner 的数据,预计到 2023 年,计算产业的规模将超过 2 万亿美元。挑战越大,机会也就越大。

华为计算产业战略

华为主要从四个方面布局计算产业,包括对架构创新的突破、对全场景处理器家族的投资,坚持有所为有所不为的商业策略,以及不遗余力地构建开放生态。


架构创新:产业界算力稀缺,摩尔定律接近极限,处理器架构需要匹配算力增速。基于此,华为推出达芬奇架构,这是业界唯一能够覆盖“端、边、云”全场景的处理器架构。


投资全场景处理器家族:华为已经发布了多个系列的处理器。具体包括支持通用计算的鲲鹏系列,支持 AI 的昇腾系列,支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列。未来对于处理器的投资还将继续。


商业策略:不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。通过硬件开放、软件开源、使能应用开发和迁移这三大步,实现共赢。


构建开放生态:4 年前发布的沃土计划已经孵化了超过 130 万开发者和 14000 多家 ISV,今后将投入 15 亿美元全面升级。

处理器,全面落地

在通用计算领域,华为投资的鲲鹏系列已经陆续上市。在板卡、服务器、操作系统、数据库、编译器等关键技术和领域也在持续投资,以打造一个依托于鲲鹏处理器的生态链。华为已经同北京、上海、深圳等地的政府和合作伙伴一起,打造基于鲲鹏的生态基地,以培养产业人才,孵化产业标准。


在 AI 计算领域,华为去年发布了全栈全链路的 AI 解决方案。胡厚崑表示,当时只交付了用于推理的昇腾 310 处理器和 ModelArts 应用开发平台,所以业界和合作伙伴对其能力存疑。今年,用于训练的昇腾处理器和 AI 计算框架 MindSpore 也已正式发布,该解决方案已全面落地。

Atlas 家族一年记

Atlas 首次亮相是在一年前的全联接大会上,它是 2017 年发布的 Atlas 智能云硬件平台的全新演进。当时发布的产品包括:面向端侧的 Atlas 200 AI 加速模块、面向数据中心侧的 Atlas 300 AI 加速卡、面向边缘侧的 Atlas 500 智能小站、及定位于企业领域一站式 AI 平台的 Atlas 800 AI 一体机。


2019 年 4 月,华为宣布 Atlas 人工智能计算平台系列产品正式上市,开启了 Atlas 商用新篇章,并同时发布了 Atlas 200 AI 加速模块、Atlas 200 DK AI 开发者套件、Atlas 300 AI 加速卡、Atlas 500 智能小站等新产品,可广泛用于“平安城市、智能交通、智能医疗、智能零售、智能金融”等领域。


今年的全联接大会上,Atlas 900 的能力更是让人惊叹:现场展示的一张南半球的星空图上有 20 万颗星星,这是来自于 SKA 射电望远镜的数据。



当前条件下,天文学家要从这 20 万颗星星中,找出某种特征的星体会相当困难,需要 169 天的工作量。而使用 Atlas 900,只用 10 秒就可以从 20 万颗星星中检索出相应特征的星体。


据了解,目前 Atlas 900 已经被部署在了华为云上,并将以极优惠的价格向全球科研机构和大学开放。


2019-09-18 11:173359
用户头像
陈思 InfoQ编辑

发布了 584 篇内容, 共 308.5 次阅读, 收获喜欢 1306 次。

关注

评论 2 条评论

发布
发现更多内容

Python进阶(五十三)Flask Web开发实现将表单渲染成HTML

No Silver Bullet

Python flask web开发 11月月更

【Logback+Spring-Aop】实现全面生态化的全链路日志追踪系统服务插件「Logback-MDC篇」

码界西柚

log4j logback 全链路追踪 11月日更 MDC

Java中的String类常用方法

共饮一杯无

Java string 11月月更

2022成功入职阿里:阿里的三套Java研发岗面试题总结(文末有答案)

钟奕礼

Java java面试 java编程 程序员、

8年Java开发含泪刷题,架构岗现在好难进,有点崩溃

钟奕礼

Java 程序员 java面试 java编程

阿里、百度、美团、面试题大集合,愿你更轻松拿下大厂offer

钟奕礼

Java java面试 java编程 程序员、

如何召回流失用户

穿过生命散发芬芳

11月月更 流失召回

霸榜巨作!阿里内部顶级大佬整理(Redis 5设计与源码分析)

钟奕礼

Java 程序员 java面试 java编程

这20道微服务面试题,阿里、字节、美团、百度面试都问了

钟奕礼

Java 程序员 java面试 java编程

Redis分布式锁剖析和几种客户端的实现

C++后台开发

redis 分布式 后端开发 C++开发

算法题学习---链表的奇偶重排

桑榆

算法题 11月月更

网络核心笔记(二)

lxmoe

学习笔记 网络 11月月更

GitHub标星75k,阿里15W字的Spring高级文档(全彩版),真的太香了

程序知音

Java spring ssm java架构 后端技术

三到五年互联网公司Java面试题大全

钟奕礼

Java 程序员 java面试 java编程

一文搞懂MySQL表字段类型长度的含义

闫同学

MySQL 数据库 11月月更

Java 后端 100多道面试题,多看点题,没坏处!

钟奕礼

Java 程序员 java面试 java编程

仅hashmap一道面试题我就搞定了面试官成功入职面试官:我裂开了

钟奕礼

Java java面试 java编程 程序员、

网络核心笔记(一)

lxmoe

学习笔记 网络 11月月更

2022年华为Java面经,还没搞懂JVM

钟奕礼

Java 程序员 Java 面试 java编程

API渗透测试4个关键步骤

阿泽🧸

11月月更 API渗透测试

集合工具类Collections指南,以及Comparable和Comparator排序详解

共饮一杯无

Java 集合 11月月更

2022全网最全最新Java面试题-独家内部教材

钟奕礼

Java 程序员 java面试 java编程

从基础到实战,阿里巴巴高并发系统设计全彩版手册限时开源

Java全栈架构师

程序员 面试 程序员人生 高并发 架构师

亿级万物互联新时代的物联网消息中间件EMQX调研

宋小生

物联网 mqtt emqx

赞不绝口!仅靠阿里P9分享的 Redis 工作手册,拿到60W年薪Offer

程序知音

Java 数据库 redis 后端技术 Redis 6.0

LeetCode题解:783. 二叉搜索树节点最小距离,栈,JavaScript,详细注释

Lee Chen

JavaScript 算法 LeetCode

华为发布全球最快AI训练集群Atlas 900_AI&大模型_陈思_InfoQ精选文章