【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

仅售 99 美元!英伟达发布最小 AI 计算机 Jetson Nano

  • 2019-03-19
  • 本文字数:4786 字

    阅读完需:约 16 分钟

仅售99美元!英伟达发布最小AI计算机Jetson Nano

3 月 17 日,GTC 2019 来了,英伟达 CEO 黄仁勋的主题演讲放在了北京时间 3 月 19 日的上午 5:00。还是熟悉的皮夹克,还是熟悉的黄教主。与往年有些不同的是,英伟达此次是带着“翻身”的必胜决心来的,最新发布的 GPU 架构“安培”(Ampere),或将成为英伟达翻身的关键。InfoQ 也对本次大会进行了详尽报道。

2018 年 GTC China 大会前夕,英伟达惊爆股价遭受“腰斩”。与此同时,2018 年发布的高端显卡 RTX 2080 Ti 出现花屏问题,导致不少用户对于英伟达的新品质量产生质疑,股价一跌再跌。

GTC 2019 之前,英伟达花费 69 亿美元巨款收购了专门从事数据中心和高性能计算的光互连技术的以色列公司 Mellanox,那时就有专家表示:英伟达扭转颓势的机会到了。

不变的套路:先秀图像计算能力

北京时间 5:05,发布会正式开始。


黄老板一开场就激动地说,有太多想要告诉大家的,当然套路是不变的,秀肌肉是必须的。


作为图像处理芯片起家的企业,首先当然还是要谈谈英伟达在图像处理领域的进展。


随着企业转向人工智能与深度学习、机器学习和数据分析,为了应对强度越来越大的计算需求,英伟达推出了 CUDA-X AI,旨在加速数据科学工作负载,使数据更有用。



据介绍,CUDA-X AI 解锁了 NVIDIA Tensor Core GPU 的灵活性,能够将机器学习和数据科学工作负载加速多达 50 倍,由十几个专用加速库组成。这些库一起加速了典型 AI 工作流程的每一步,无论是使用深度学习来训练语音和图像识别系统,还是数据分析来评估抵押贷款组合的风险状况,这些工作流程中的每个步骤都需要处理大量数据,每个步骤都受益于 GPU 加速计算。


之后,黄老板正式开始图像性能的展示。


首先秀出的是 RTX 强大的画面处理能力。下面两张图中,左侧为真实的汽车图片,而右侧则是由 RTX 渲染之后的虚拟图像,足以乱真的处理能力,不得不令人惊叹。



和去年的套路一样,为了凸显 RTX 的计算能力,黄老板疯狂演示有 RTX 和没有 RTX 的画面有什么区别。



RTX OFF



RTX ON


之后,黄仁勋发布 OMNIVERSE,这是一个用于多工具工作流程的开放式交互式 3D 设计协作平台。



Omniverse 包括门户(双向通道),可以维护行业标准应用程序(如 Autodesk Maya、Adobe Photoshop 和 Epic Games 的虚幻引擎)之间的实时连接。


这个新的开放式协作平台简化了跨行业的 2D 和 3D 产品管道。Omniverse 是围绕最新的设计协作行业标准而构建的。它支持 Pixar 的通用场景描述技术,用于在多个应用程序之间交换有关建模、着色、动画、灯光、视觉效果和渲染的信息,还可以支持 NVIDIA 的材料定义语言,允许设计者跨多个工具交换有关表面材料的信息。


此外,为了满足数据中心和云图形应用不断增长的需求,英伟达发布 RTX SERVER POD。



从好莱坞电影公司对于电影画面不断增长的需求,到对 5G、云游戏和 VR 流媒体的新兴需求,各行各业对计算能力的需求从未像现在这么大。


以前,运行功能强大到能够实时提供丰富的视觉内容的服务器是非常昂贵的,但是现在,情况变了。


黄仁勋在现场发布了 RTX 服务器,它包括完全优化的软件栈用于 Optix RTX 渲染、游戏、虚拟现实和基于“增大化现实”技术,专业的可视化应用程序,现在可以提供电影质量的图形增强效果,射线追踪的成本远远低于电力 CPU-based 呈现相同集群性能的成本。


数据!数据!数据!


黄仁勋认为:数据科学是计算机科学领域变化最快的领域。


的确,随着人工智能时代的来临,数据早已不是计算机领域独占的资源,几乎所有行业都在努力与数据科学以及 AI 接轨,因此,数据资源也显得愈发重要。


无论是推进科学,建立自动驾驶汽车还是从大量数据中收集业务洞察力,数据科学家,研究人员和开发人员都需要强大的 GPU 计算能力。他们还需要合适的软件工具。


NVIDIA 扩展了 NGC 软件中心,为数据科学家提供了更快地构建优化解决方案的工具,NGC 的新模型注册表为数据科学家和研究人员提供了最流行的 AI 模型库,为他们提供了重新训练、基准测试和快速构建 AI 应用程序的起点。NGC 企业帐户持有者还可以通过托管私有注册表在其组织和团队中上传,共享和版本化自己的模型。



CUDA-X AI 生态


NGC 还提供模型训练脚本,其最佳实践利用 NVIDIA Tensor 内核提供的混合精度,使 NVIDIA Turing 和 Volta GPU 在前几代培训和推理中提供高达 3 倍的性能加速。通过提供经过精确度和融合测试的模型和培训脚本,NGC 为用户提供了最重要的 NVIDIA 深度学习资产的集中和管理。



数据从根本上改变了公司的业务方式,推动了对数据科学家的需求,并增加了工作流程的复杂性。英伟达为数据从业者打造了一套专业的工作站,由领先的工作站提供商构建,将 Quadro RTX GPU 的强大功能与加速的 CUDA-X AI 数据科学软件相结合,为数据科学提供新一代完全集成的工作站。



通过 Quadro RTX GPU 驱动的工作站,从业者可以将 RTX 的强大功能带入数据科学工作流程。获得高达 96 GB 的超快速本地内存,以处理最大的数据集和计算密集型工作负载。使用 Quadro RTX,使用者可以最大限度地提高工作效率,缩短洞察时间并降低数据科学项目的成本,并建立工作站以确保最高级别的兼容性、支持和可靠性。


NVIDIA 驱动的数据科学工作站配备了一整套经过测试和优化的数据科学软件,建立在 NVIDIA CUDA-X AI 之上。该堆栈具有 RAPIDS 数据处理和机器学习库,NVIDIA 优化的 TensorFlow,PyTorch,Caffe 和 其他领先的数据科学软件,为企业提供加速工作流程,以加快数据准备,模型培训和数据可视化。

最小计算机与自动驾驶

黄仁勋在演讲中表达了对自动化机器人发展的惊叹,机器人早已不是科幻电影中的幻想,机器人早已深入人们生活的方方面面,而人工智能技术是支撑自动化机器人发展的关键。



随后,黄仁勋掏出一块非常小的线路板,正式发布 Jetson Nano,一款人工智能计算机,据称,这款设备可以创建数百万个智能系统。




近景


Jetson Nano 支持高分辨率传感器,可以并行处理多个传感器,并可在每个传感器流上运行多个现代神经网络。它还支持许多流行的 AI 框架,使开发人员可以轻松地将他们喜欢的模型和框架集成到产品中。


Jetson Nano 的主要参数包括:


  • GPU:基于 128 核 NVIDIA Maxwell?架构的 GPU

  • CPU:四核 ARM?A57

  • 视频:4K @ 30 fps(H.264 / H.265)/ 4K @ 60 fps(H.264 / H.265)编码和解码

  • 相机:MIPI CSI-2 DPHY 通道,12x(模块)和 1x(开发人员套件)

  • 内存:4 GB 64 位 LPDDR4; 25.6 千兆字节/秒

  • 连接:千兆以太网

  • 操作系统支持:适用于 Tegra?的 Linux

  • 模块尺寸:70mm x 45mm

  • 开发者套件尺寸:100mm x 80mm


售价方面,Jetson Nano 有两个版本:面向开发人员、制造商和发烧友的 99 美元开发套件以及面向希望创建大众市场边缘系统的 129 美元版本。



黄仁勋卖萌:只卖 99 刀!


之后,黄仁勋发布了 NVIDIA Isaac SDK,这是一套为开发人员提供 Isaac 应用程序的工具包,包含 Gems(机器人功能)、机器人引擎和 Sim 的访问。它将为制造商、研究人员和初创公司节省数百小时的研发时间,使其更容易为感知、导航和操作添加 AI 到下一代机器人中。



其核心是 Isaac Robot Engine,它使开发人员能够构建易于部署到 Jetson 平台的模块化和高速机器人应用程序。还有 20 多个 GEM,为导航和感知算法等硬机器人问题提供即插即用功能。(GEM 是为 NVIDIA Jetson AGX 平台构建和优化的基本机器人算法模块。)


在自动驾驶领域,黄仁勋介绍到:目前英伟达的技术已经深入到无人车制造到路测的各个阶段,不论是地图重建、模拟测试,还是传感器升级,都有英伟达的技术支持。



随后,黄仁勋正式发布 Level 2+ 的自动驾驶解决方案 NVIDIA DRIVE AP2X。


NVIDIA DRIVE AP2X 是一套包括 DRIVE AutoPilot 自动驾驶软件、 DRIVE AGX 自动驾驶平台以及 DRIVE 验证工具的解决方案,通过 NVIDIA Xavier 执行 DRIVE AV 自动驾驶与 DRIVE IX 智能驾驶仓等功能,为驾驶辅助提供包括车队车、车对路,以及车对人等安全辅助。



同时,黄仁勋表示英伟达将在下一季推出全新的 DRIVE AP2X 9.0,包括更深度的神经网络、人脸识别以及更多类型传感器的支援,其中也将导入用于识别车路与地标的 MapNet ,以强化车路协同机能;此外,新版本还会加入 ClearSightNet ,可使摄像头在强光环境下,或是受到极端天气干扰时,通过如传感器强制清洁等方式清理阻碍。


英伟达的“触底反弹”

2018 年对英伟达确实不太友好。


8 月亮相的高端显卡系列:GeForce RTX 2080,RTX 2080 Ti,和 RTX 2070 虽然在发布之初赚足了吆喝,但是 RTX 2080 Ti 出现的花屏问题却让英伟达不得不为产品质量道歉并提供后续服务。



2018 年 11 月 16 日,英伟达第三季度财报显示:该营收 31.8 亿美元,非 GAPP 每股摊薄收益为 1.84 美元,均低于分析师预期。11 月 21 日,英伟达股价再受重挫,收跌 12%,两日暴跌超 28%,市值已不足 900 亿美元,自 10 月的高位已经腰斩。


2019 年 2 月,英伟达发布截至 1 月 27 日的 2019 财年第四财季及全年财报,报告显示,英伟达第四财季营收为 22.05 亿美元,比去年同期的 29.11 亿美元下滑 24%;净利润为 5.67 亿美元,比去年同期的 11.18 亿美元下滑 49%。


从这一组数据中,我们看到的尽是“下滑”、“下跌”等等字眼,不难看出,英伟达的 2018 年过的实在有些艰难,甚至在 2018 年底的 GTC China 上,黄老板直接取消了媒体提问环节。


受到去年加密货币热潮退散的影响,英伟达的芯片出现了积压的情况,旧产品难以销售,新产品质量又出现问题。不过,黄仁勋很快就意识到问题的所在,他在财报发布后的电话会议上非常简单地说:“世界需要更多的计算。”


正是这句话,令业内人士重新对英伟达燃起信心。


美国财经网站 CNBC 股评人 Jim Cramer 表示:投资者可以相信,英伟达在发布业绩报告后股价已经触底,虽然加密货币挖掘市场的繁荣不会卷土重来,但是市场即将正常化,首先是在游戏领域,然后是数据中心。


人工智能、深度学习依旧需要大量的算力,所以这一领域的红利依旧在增长,英伟达仍然被需要。此外,随着英伟达的 GPU 与 Mellanox 的互连相结合,数据中心工作负载将在整个计算,网络和存储堆栈中进行优化,并能实现更高的性能,更高的利用率和更低的运营成本,未来,英伟达与 Mellanox 或许会在 AI 领域创造出更多的价值。

消失的 7nm“安培”架构

早在本次发布会前夕,有关英伟达 7nm 制程的下一代“安培”(Ampere)GPU 架构的猜测就已经遍布全网,去年年底的 GTC China 大家没有看到新品,所以对于这次的 GTC 大会,所有人都显得格外激动。


可是…


没想到这浓眉大眼的黄仁勋也学会涮人了…


传说中的安培架构并没有出现。




更多内容,请关注 AI 前线!



公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-03-19 09:4722585
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.2 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

springboot2.3手册:多租户及自动创建数据,这样做

互联网应用架构

springboot mybaitsplus 多租户 自动填充基础信息

Java ConcurrentHashMap 高并发安全实现原理解析

vivo互联网技术

Java hashmap 多线程 高并发

拆分链表、图解HTTPS、Zookeeper原理、如何成为技术专家、架构师三板斧 John 易筋 ARTS 打卡 Week 18

John(易筋)

ARTS 打卡计划 图解https ZooKeeper原理 架构师三板斧 拆分链表

JavaScript原型机制

Clloz

Java 原型

rpc探路(一)

余歌

Java新特性:数据类型可以扔掉了?

Java 编程 架构师

第十一周.命题作业

刘璐

使用递增计数器的线程同步工具 —— 信号量,它的原理是什么样子的?

程序员小航

Java 源码 源码阅读 JUC Semaphore

我的 2020 iOS BAT面试心得:Bigo、字节、快手、伴鱼、百度、微博等

iOSer

ios 面试

Golang框架探索(一)

余歌

Web框架 Go web

收藏手册:Docker安装RabbitMQ,只需3步

互联网应用架构

Docker RabbitMQ

当代开发者的好帮手,浅析.NET敏捷开发框架的优势与特点

Learun

敏捷开发 开发工具

高难度对话读书笔记

wo是一棵草

收藏手册:该不该用Lombok?15个常用注解全解析

互联网应用架构

lombok

站在巨人的肩膀上学习:五位阿里大牛联手撰写的《深入浅出Java多线程》

Java架构之路

Java 编程 面试 并发编程 多线程

Kotlin 插件1.4.10使用报错

三爻

android kotlin

谈谈力软快速开发平台B/S专业报表工具

Philips

敏捷开发 开发工具

Java开发连Redis都不会还想跳槽涨薪?先把Redis的知识点吃透再说

Java架构之路

Java redis 编程 程序员 面试

(0)skynet序章

休比

LeetCode题解:144. 二叉树的前序遍历,递归,JavaScript,详细注释

Lee Chen

大前端 LeetCode

The Way To Go --- 切片

书旅

slice Go 语言

第十一周.总结

刘璐

测试工程师在敏捷项目中扮演什么角色?

禅道项目管理

程序员 敏捷开发 测试

架构设计:微服务架构如何划分?这6个标准原则让你一目了然

互联网应用架构

微服务 架构设计

2020 恒生 LIGHT 开发者大会,早鸟票限时开售

DT极客

(1)skyent VMware Workstation Pro下载与安装

休比

大作业2

雪涛公子

Golang 反射性能优化

余歌

性能优化 Go 语言

实践解读丨Python 面向对象三大特征之多态

华为云开发者联盟

编程 面向对象

分布式数据库拆分常用之法

华为云开发者联盟

数据库 架构 分布式

深耕边缘计算 揭秘阿里云边缘云网一体化的技术实践

阿里云Edge Plus

5G 边缘计算 视频

仅售99美元!英伟达发布最小AI计算机Jetson Nano_AI&大模型_陈思_InfoQ精选文章