英特尔首款AI芯片终发布，云端训练推理两用，却不是7nm制作工艺_AI_张之栋

FCon7折倒计时最后一周：日程已上线70%！查看详情>>> 了解详情 



 写点什么

据英特尔Newsroom消息，当地时间 8 月 20 日，英特尔在 Hot Chips 2019 大会上，公布了即将推出的高性能人工智能（AI）加速器的新细节：英特尔 Nervana 神经网络处理器——NNP-T 用于训练，NNP-I 用于推理。

英特尔在人工智能领域投入颇多，自 2015 年起，便陆续收购了 Altera、Nervana Systems、Movidius 以及 Vertex. ai，现在英特尔除 FPGA 产品线外，还推出了 Nervana 深度学习加速器，在 Hot Chips 2019 大会上，英特尔公布了 Nervana NNP 神经网络处理器的相关细节，包括云端训练用神经网络处理器 NNP-T 和云端推理用神经网络处理器 NNP-I，据英特尔称，NNP-I 已经被 Facebook 采用。

英特尔 Nervana NNP-I

英特尔 Nervana NNP-I，为推理而专门设计，又称 Spring Hill，利用英特尔 10nm 制作工艺与 Ice Lake 内核。

NNP-I 基于英特尔 10nm 制作工艺的 Ice Lake 处理器架构设计，功耗在 10-50w 之间。在数据中心推理工作负载中，NNP-I 的运算效率可达 4.8TOPs/W；推理计算引擎 ICE 则主要由深度学习计算网格、可编程矢量处理器、高带宽内存接口、超大本地缓存组成，可支持 FP16、INT8、INT 4/2/1 的浮点运算。

此外，NNP-I 提供高度可编程性，随着 AI 在每个工作负载中普及，拥有一个易于编程的专用推理加速器，并且对包括 ONNX，nGraph，OpenVINO，C++等主要深度学习框架的支持，有助于公司充分利用其数据进行可编程设计。

英特尔称，随着人工智能领域对复杂计算的需求增长，这款新芯片将可为大型公司使用的英特尔至强（Intel Xeon）处理器提供帮助。Facebook 已经开始使用该人工智能处理器。

英特尔 Nervana NNP-T

英特尔 Nervana NNP-T（神经网络训练处理器），又称 Spring Crest，将由台积电制造，并采用 16nm FF+工艺。

Nervana 在被英特尔收购之前，就已经利用台积电的 28nm 处理器构建起第一代 Lake Crest 设计。因此，作为相关设计规则与制造工艺的继承者，Spring Crest 当中仍然保留了不少台积电的专利成果。英特尔方面在新一代芯片中也继续沿用台积电的工艺，但同时将更多自己的专利成果整合到架构当中——包括功率控制与偏移技术——由此创造出这款集合了“英特尔最佳元素与 Nervana 最佳元素”的芯片。

NNP-T 的计算核心拥有 270 亿晶体管，包括 24 个 Tensor Processors（TPC）。除了 TPC 外，芯片裸片中还有 60MB 的 SRAM 以及一些专用的接口，如 IPMI、I2C 及 16 条 PCI-E 4.0 通道。芯片的工作频率为 1.1GHz，风冷条件下功率配置为 150W 到 250W，可通过水冷获得更强大的性能表现。同时 NNP-T 还拥有 OCP 卡及 PCI-E 两种规格，以供数据中心选择。

英特尔公司希望通过开源 nGraph 库以及负责将各框架连接至硬件后端的编译器，对大部分软件复杂性进行抽象。英特尔目前正在使用的框架包括 Paddle Paddle、Pytorch 以及 TensorFlow。

一级客户将拥有对底层硬件的访问权限，而其他“更为广泛”的客户将能够访问内核库。英特尔公司将在明年开放自己的高级编程语言，允许客户根据需求编写出自己的内核。此举的主要目标是实现简化，过高的复杂性最终必将占用掉宝贵的芯片面积。因此，自定义 ISA 将非常简单，确保英特尔将芯片区主要分配给乘法器与存储器。此外，芯片巨头还构建起独家深度学习原语指令。

英特尔公司表示，其将在今年年底之前向首批客户提供 NNP-T 样品，主要包括各一级云服务供应商。接下来，2020 年 NNP-T 产品将正式大规模投放市场。

写在后面

如今，人工智能与机器学习已经风靡数据中心，而随着以 AI 训练类工作负载为主体的各类解决方案的快速兴起，GPU 也开始成为超级计算领域一颗耀眼的新星。2008 年，还没有任何一台超级计算机使用 GPU 进行计算——其仍主要依靠久经考验的 CPU。但现在，全球超算五百强榜单当中，有 80%的计算能力由 GPU 贡献而来。相信很多朋友已经意识到，高性能计算与超级计算的发展方向正朝着更为广泛的数据中心移动，而 AI/ML 类工作负载的激增无疑将给英特尔在数据中心领域的主导地位构成严重威胁。毕竟，每安装一块 GPU，都会有几块至强处理器失去“工作岗位”。

英特尔副总裁兼人工智能产品集团总经理 Naveen Rao 表示，数据中心和云计算需要访问高性能和可扩展的通用计算，以及对复杂 AI 应用程序的专用加速。在未来的 AI 愿景中，需要采用“从硬件到软件再到应用程序”的整体方法。

本次英特尔推出的 Nervana 神经网络处理器，都将用于数据中心，NNP-T 用于云端训练，NNP-I 用于云端推理。而且就英特尔官方数据，NNP-I 在推理上的速度已经超过英伟达 Tesla P4，虽不及 V100，但差距不大。

尽管英特尔此次推出芯片的制作工艺还不是最先进的 7nm，在性能上也稍微有些不足，但英特尔的此次“亮剑”无疑给出一个强烈的信号——AI 硬件领域的竞争将会更加激烈。

发布

暂无评论

扫码添加小助手
领取最新资料包

创作场景

英特尔首款 AI 芯片终发布，云端训练推理两用，却不是 7nm 制作工艺

英特尔 Nervana NNP-I

英特尔 Nervana NNP-T

写在后面

评论

模块八：作业

TDengine 离线升级流程

java培训流Stream循环遍历list

使用 JavaScript 开发AR(增强现实)移动应用的预备知识和环境搭建

我常用的两个翻译神器！程序员必备 | JavaGuide

学生管理系统架构设计文档

大数据培训 Yarn和Spark配置与说明

得物技术埋点自动化验证的探索和最佳实践

什么是DevOps?为大家都在用DevOps

写入速度提升数十倍，TDengine 在拓斯达智能工厂解决方案上的应用

web前端培训如何定位 MySQL 中DDL 被阻塞

助力工业化设计，提升变电站三维设计效率和业务保障

Wallys/Network_Card/DR9074-2.4G-PN01.1-Wifi-6-Qualcomm-QCN9074

优酷端侧弹幕穿人技术实战之：PixelAI移动端实时人像分割

C#/VB.NET 在Word中设置纯色/渐变/图片背景

OA协同办公系统的发展趋势

明道云入围“2022年中国低/零代码行业影响力TOP15”

一图看懂：融云视频会议四大“护法”，让云端开会不再“裸奔”

基于QUIC协议的HTTP/3正式发布！

web技术分享| 基于vue3实现自己的组件库，第一章：Message组件

以字节跳动内部 Data Catalog 架构升级为例聊业务系统的性能优化

InfoQ 极客传媒 15 周年庆征文|什么是云原生，云原生技术为什么这么火？

Linux命令汇总 | vim | shell | 进阶【2022版】

Vue 中 JSX 的基本用法

JWT 登录认证及 Token 自动续期

2022年中国现制柠檬茶市场发展洞察

“复制黏贴”就能打通企微群机器人，包学包会

SAS击球实验室向青少年展示数据与分析的价值

电商后台权限设置有哪些规范你知道吗！

刘勇智：一码通缺陷分析与架构设计方案丨声网开发者创业讲堂 Vol.02

我是一个Dubbo数据包...

创作场景

英特尔首款 AI 芯片终发布，云端训练推理两用，却不是 7nm 制作工艺

英特尔 Nervana NNP-I

英特尔 Nervana NNP-T

写在后面

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载