写点什么

英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍

  • 2021-04-13
  • 本文字数:1590 字

    阅读完需:约 5 分钟

英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍

当今最大的 AI 模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的 CPU,可以与 GPU 紧密结合,以消除系统瓶颈。


北京时间 4 月 13 日凌晨,英伟达在 GCT 2021 大会上宣布了 Grace、BlueField-3 DPU,还有用于自动驾驶的汽车 SoC 芯片三款处理器,均基于 Arm 架构打造。


其中最引人瞩目的当属名为 Grace 的 CPU 产品,这款产品主要为现代数据中心设计。这是英伟达首款服务器 CPU。英伟达认为,AI 模型的数据量和规模正在成倍增长。当今最大的 AI 模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的 CPU,可以与 GPU 紧密结合,以消除系统瓶颈。

Grace 名字来自于计算机科学家 Grace Hopper,她曾是哈佛首批 Mark 1 程序员,并且发明了第一个链接器。据了解,Grace 芯片基于 Arm 打造,内置 Arm Neoverse 核心。


Grace 整个 SoC 由多个芯片组合构成,它主要有三个部分,分别是 CPU、GPU 和内存 /IO 子系统。英伟达表示,Grace CPU 将能够在 SPECrate2017_Int_base 中提供 300 分以上的成绩。对于这样的跑分,英伟达宣称 Grace 的性能基础是第四代 NVIDIA NVLink 互连技术,该技术在 Grace 和 NVIDIA GPU 之间连接速度超过 900GB/s,相当于目前服务器 14 倍的带宽;从 CPU 到 CPU 的速度超过 600GB/s。


据英伟达官方透露,Grace 还将采用 LPDDR5x 内存子系统,与 DDR4 内存相比,可提供两倍的带宽和 10 倍的能效,也就意味着,如果服务器使用这款 CPU,那么整套系统可以提供相较于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。此外,新的架构提供了统一的缓存一致性和单一的内存地址空间,将系统和 HBM GPU 内存结合在一起,简化了可编程性。


在 Grace 发布尾声,英伟达透露,Grace 将得到 NVIDIA HPC 软件开发包和全套 CUDA 和 CUDA-X 库的支持,这些库可以加速超过 2000 个 GPU 应用,加快科学家和研究人员对世界上最重要挑战的发现。

GraceCPU 预计将于 2023 年初上市,瑞士国家超级计算机中心(CSCS)和美国能源部的洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)将率先建造 NVIDIA CPU 驱动的超级计算机。


两大 AI 框架应对网络安全和语音对话需求

如今,网络安全已经成为每个企业乃至国家安全的重要防线。为了促进网络安全合作伙伴拥有检测和缓解网络安全攻击的 AI 技能,英伟达发布了一个“云原生”应用框架—Morpheus。Morpheus 运行时可以让网络中的计算节点充当传感器,对网络安全威胁进行监测,以作出自主响应。


Morpheus 内置机器学习模块,开发者可以使用深度学习模型创建自己的 Morpheus 技能,以此为基础,Morpheus 可以更加智能地识别、捕获威胁和异常情况,包括敏感数据的泄露、网络钓鱼企图和恶意软件,并对其采取行动。与传统网络安全框架相比,Morpheus 可以在同等投入下分析更多安全数据,且不会影响其性能。


除了 Morpheus,同样引人瞩目的 AI 框架还有 Jarvis。

在疫情大背景下,语音消息成为企业间相互联系,甚至是生活中线上沟通最常用的方式。为了应对日益增长的语音消息传递需求,英伟达宣布对话式 AI 框架 Jarvis 开始提供对手机和消息的普遍适用性。


简单来说,Jarvis 为开发人员提供预先训练的 AI 模型和软件工具,以创建交互式对话体验。据了解,Jarvis 模型的预览版在 2020 年 5 月首次推出,可为对话代理提供自动语音识别,语言理解、实时语言翻译和文本转换语音功能。


与此前相比,此次发布新版本的主要特性在于,该框架为更多开发人员开放了预先训练的开发模型和软件工具。据了解,Jarvis 的模型训练投入了超过 10 亿页的文本和超过 6 万小时的语音,如今,这些模型可以通过自定义数据进行调整、优化、微调,同时还能根据不同的任务、行业和系统进行定制,具有更优秀的普适性。


参考链接:

https://www.cnbeta.com/articles/tech/1113887.htm

https://www.cnbeta.com/articles/tech/1113901.htm

https://www.cnbeta.com/articles/tech/1113891.htm


2021-04-13 17:153673
用户头像

发布了 74 篇内容, 共 30.7 次阅读, 收获喜欢 83 次。

关注

评论

发布
暂无评论
发现更多内容

Spring容器获取Bean的9种方式 | 京东云技术团队

京东科技开发者

spring Spring Boot bean 企业号 7 月 PK 榜

用ChatGPT搞定K8s!

互联网工科生

k8s kubernetes 运维 ChatGPT

时序数据库 TDengine 与 DBeaver 达成合作,生态系统再壮大

爱倒腾的程序员

涛思数据 tdengine 时序数据库

大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

语音房源码搭建技术分享之降噪功能详解

山东布谷科技

软件开发 源码搭建 语音房源码 语音房

谁是家居智能化时代“头号玩家”? 小度全屋智能将登陆中国建博会

新消费日报

软件DevOps云化发展的趋势 【课程限时免费】

华为云PaaS服务小智

云计算 DevOps 云原生 华为云 华为开发者大会2023

技术分享| 融合通讯的架构介绍

anyRTC开发者

音视频 MCU mesh SFU 融合通讯

对线面试官-Redis(五 为什么这么快为什么能抗住高并发)

派大星

Java 面试题

ReentrantLock源码解析 | 京东云技术团队

京东科技开发者

线程 企业号 7 月 PK 榜 并发问题

软件测试/测试开发丨函数式编程学习笔记

测试人

Python 程序员 软件测试 函数式

一篇文章带你上手性能测试框架K6

QE_LAB

自动化测试框架 测试自动化 #性能测试

第九届“互联网+”大赛产业赛道百度命题正式公布!57道命题,等你揭榜!

飞桨PaddlePaddle

人工智能 百度

inBuilder今日分享丨系统集成系列之异构接入

inBuilder低代码平台

集成

腾讯云DSQL-C MYSQL 版本测评

查拉图斯特拉说

MySQL sql 腾讯云

可信数据库大会,不见不散!

KaiwuDB

KaiwuDB 2023可信数据库发展大会

浪潮信息直播高能预告!令人感兴趣的高性能架构、CXL技术、数据库等硬件相关技术分享来了 | 第 83-85 期

OpenAnolis小助手

开源 高性能架构 龙蜥大讲堂 RDMA 浪潮信息

HarmonyOS极客松“上分秘籍”! 高手们顶峰相见!

HarmonyOS开发者

HarmonyOS

国内首批!腾讯云EdgeOne通过信通院边缘计算最新评估

极客天地

Net DB Web多级缓存的实现

不在线第一只蜗牛

HTTP net web api

把LangChain跑起来的3个方法 | 京东云技术团队

京东科技开发者

人工智能 LLM langchain 企业号 7 月 PK 榜

扫光动效在移动端应用实践

百度Geek说

动效 移动端 企业号 7 月 PK 榜

火山引擎 DataLeap 构建Data Catalog系统的实践(一):背景与调研思路

字节跳动数据平台

如何自动化测试你的接口?—— Rest Assured

不在线第一只蜗牛

自动化 自动化测试 API

EMAS热修复Sophix适配App加固的技术方案

移动研发平台EMAS

阿里云EMAS 移动热修复 app热修复 app加固

分布式事务的几种实现方式 | 京东云技术团队

京东科技开发者

事务 分布式, 企业号 7 月 PK 榜

早8人的效率工具六件套

树上有只程序猿

英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍_硬件_施尧_InfoQ精选文章