阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍

  • 2021-04-13
  • 本文字数:1590 字

    阅读完需:约 5 分钟

英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍

当今最大的 AI 模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的 CPU,可以与 GPU 紧密结合,以消除系统瓶颈。


北京时间 4 月 13 日凌晨,英伟达在 GCT 2021 大会上宣布了 Grace、BlueField-3 DPU,还有用于自动驾驶的汽车 SoC 芯片三款处理器,均基于 Arm 架构打造。


其中最引人瞩目的当属名为 Grace 的 CPU 产品,这款产品主要为现代数据中心设计。这是英伟达首款服务器 CPU。英伟达认为,AI 模型的数据量和规模正在成倍增长。当今最大的 AI 模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的 CPU,可以与 GPU 紧密结合,以消除系统瓶颈。

Grace 名字来自于计算机科学家 Grace Hopper,她曾是哈佛首批 Mark 1 程序员,并且发明了第一个链接器。据了解,Grace 芯片基于 Arm 打造,内置 Arm Neoverse 核心。


Grace 整个 SoC 由多个芯片组合构成,它主要有三个部分,分别是 CPU、GPU 和内存 /IO 子系统。英伟达表示,Grace CPU 将能够在 SPECrate2017_Int_base 中提供 300 分以上的成绩。对于这样的跑分,英伟达宣称 Grace 的性能基础是第四代 NVIDIA NVLink 互连技术,该技术在 Grace 和 NVIDIA GPU 之间连接速度超过 900GB/s,相当于目前服务器 14 倍的带宽;从 CPU 到 CPU 的速度超过 600GB/s。


据英伟达官方透露,Grace 还将采用 LPDDR5x 内存子系统,与 DDR4 内存相比,可提供两倍的带宽和 10 倍的能效,也就意味着,如果服务器使用这款 CPU,那么整套系统可以提供相较于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。此外,新的架构提供了统一的缓存一致性和单一的内存地址空间,将系统和 HBM GPU 内存结合在一起,简化了可编程性。


在 Grace 发布尾声,英伟达透露,Grace 将得到 NVIDIA HPC 软件开发包和全套 CUDA 和 CUDA-X 库的支持,这些库可以加速超过 2000 个 GPU 应用,加快科学家和研究人员对世界上最重要挑战的发现。

GraceCPU 预计将于 2023 年初上市,瑞士国家超级计算机中心(CSCS)和美国能源部的洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)将率先建造 NVIDIA CPU 驱动的超级计算机。


两大 AI 框架应对网络安全和语音对话需求

如今,网络安全已经成为每个企业乃至国家安全的重要防线。为了促进网络安全合作伙伴拥有检测和缓解网络安全攻击的 AI 技能,英伟达发布了一个“云原生”应用框架—Morpheus。Morpheus 运行时可以让网络中的计算节点充当传感器,对网络安全威胁进行监测,以作出自主响应。


Morpheus 内置机器学习模块,开发者可以使用深度学习模型创建自己的 Morpheus 技能,以此为基础,Morpheus 可以更加智能地识别、捕获威胁和异常情况,包括敏感数据的泄露、网络钓鱼企图和恶意软件,并对其采取行动。与传统网络安全框架相比,Morpheus 可以在同等投入下分析更多安全数据,且不会影响其性能。


除了 Morpheus,同样引人瞩目的 AI 框架还有 Jarvis。

在疫情大背景下,语音消息成为企业间相互联系,甚至是生活中线上沟通最常用的方式。为了应对日益增长的语音消息传递需求,英伟达宣布对话式 AI 框架 Jarvis 开始提供对手机和消息的普遍适用性。


简单来说,Jarvis 为开发人员提供预先训练的 AI 模型和软件工具,以创建交互式对话体验。据了解,Jarvis 模型的预览版在 2020 年 5 月首次推出,可为对话代理提供自动语音识别,语言理解、实时语言翻译和文本转换语音功能。


与此前相比,此次发布新版本的主要特性在于,该框架为更多开发人员开放了预先训练的开发模型和软件工具。据了解,Jarvis 的模型训练投入了超过 10 亿页的文本和超过 6 万小时的语音,如今,这些模型可以通过自定义数据进行调整、优化、微调,同时还能根据不同的任务、行业和系统进行定制,具有更优秀的普适性。


参考链接:

https://www.cnbeta.com/articles/tech/1113887.htm

https://www.cnbeta.com/articles/tech/1113901.htm

https://www.cnbeta.com/articles/tech/1113891.htm


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-04-13 17:153144
用户头像

发布了 74 篇内容, 共 26.7 次阅读, 收获喜欢 83 次。

关注

评论

发布
暂无评论
发现更多内容

12.4G阿里巴巴面经公开:技术笔记+视频讲解+简历模板,绝了!

996小迁

Java 架构 面试 程序人生

认识Nacos注册中心

登风

nacos

每日知识总结

country

怎么理解Kafka消费者与消费组之间的关系?

码农架构

Java 架构 消息队列 消息中间件

5G机遇 | 如何解决在核心场景的高并发、超低延迟需求?

VoltDB

数据库 5G 通信 VoltDB

15道类和对象面试题,快看看自己会几道

田维常

类集

顺利拿到OPPO公司Android架构师offer,Android跨进程通信导论,全套教学资料

欢喜学安卓

android 程序员 面试 移动开发

数字货币写进多地“十四五”规划纲要草案 专家建议扩大数字人民币试点范围

CECBC

数字经济

硬核!我花5小时肝出这篇Redis缓存解决方案,带你起飞!

数据库 redis 缓存架构

从设计模式理解Vue响应式(多图警告)

coolFish(呔呆)

JavaScript vue.js 响应式 大前端 设计模式

Invalid bound statement (not found)

任广印

Java MyBatisPlus

区块链如何帮助联合国支持全球教育?

CECBC

区块链

2021最新Windows10环境下安装MacOS系统(黑苹果)亲测有效!!(VM安装黑苹果)

Z.

macos 黑苹果 windows vmware

宅米网技术架构演进分析

Andy

java中的类和object,其实没那么难~

田维常

类集

个人web分享92道JavaScript面试题附加回答

我是哪吒

程序员 面试 大前端 程序媛

太牛了!美团Android开发工程师岗位职能要求,大厂面试题汇总

欢喜学安卓

android 程序员 面试 移动开发

Java 读写锁 原来这么简单

Java架构师迁哥

Kubernetes生产环境最佳实践

xcbeyond

Kubernetes 容器 28天写作

为什么强烈推荐 Java 程序员使用 Google Guava 编程!

沉默王二

Java Guava

产品训练营--第三期作业(1)

曦语

产品训练营

Appium下的WDA使用个人开发者证书配置

行者AI

自动化测试

一文带你解读Volcano架构设计与原理

华为云开发者联盟

架构 Kubernetes 负载 Volcano 集群

技术赋能教育,浅谈教育机构转型的制胜关键

华为云开发者联盟

音视频 在线教育

区块链有望被主流接纳的四个场景

CECBC

区块链

工具介绍 | 百度开源Server-Agent:高性能、高效率的任务调度执行引擎

百度开发者中心

开源

幕后故事 | YRCloudFile助力顶级视效制作公司MORE VFX打造视觉盛宴

焱融科技

高性能 存储 焱融科技 3D渲染 影视制作

666666666666666666666

Paul

大数据

企业项目迁移go-zero全攻略(二)

万俊峰Kevin

微服务 microservice Go 语言

还在为计算机网络协议烦恼?了解这一篇就够了

Java架构师迁哥

加速AI边云协同创新!KubeEdge社区建立Sedna子项目

华为云原生团队

人工智能 开源 边缘计算 边缘技术

英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍_硬件_施尧_InfoQ精选文章