【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

基于 CPU 的深度学习推理优化部署方案和实践

  • 2019-09-24
  • 本文字数:577 字

    阅读完需:约 2 分钟

基于 CPU 的深度学习推理优化部署方案和实践

CNUTCon上海2018大会上,张磊讲师做了《基于 CPU 的深度学习推理优化部署方案和实践》主题演讲,主要内容如下。


演讲简介


随着人工智能技术在多媒体领域的广泛应用, 深度学习算法的部署对计算平台资源的需求也在飞速增长。由于 GPU 资源总数和成本的限制,我们设计和部署了基于 CPU 的深度学习推理优化方案。方案通过封装 Intel VINO SDK 提供的基于 CPU 的深度学习加速底层软件,结合 docker 及 mesos 集群技术,完成深度学习算法在云端部署的自动化和服务化,将深度学习推理的性能在 CPU 上提升了 2~10 倍以上,满足多媒体业务的深度学习部署需求, 解决了 GPU 资源的依赖和稀缺问题。


主要内容:


  1. 使用 VINO SDK 实现 CPU 上的深度学习推理性能优化;

  2. 不同深度学习算法在 CPU 上加速的性能评估和对比;

  3. 基于 Docker 及 Mesos 的集群深度学习推理应用自动化部署方案。


听众受益:


  1. 学习 CPU 上深度学习的性能优化技术和实践;

  2. 了解大规模集群的深度学习应用部署管理方案;

  3. 理解深度学习推理的性能评估和监测方法。


讲师介绍


张磊


爱奇艺 研究员


现就职于爱奇艺技术产品中心计算云团队,目前主要负责云平台上深度学习应用的优化落地方案。加入爱奇艺之前就职于英特尔亚太研发有限公司,负责底层图形图像软件设计和实现,对 CPU,GPU 上应用的性能分析和优化有丰富的经验。












完整演讲 PPT 下载链接


https://cnutcon.infoq.cn/2018/shanghai/#schedule


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-09-24 15:081236
用户头像

发布了 40 篇内容, 共 25.6 次阅读, 收获喜欢 142 次。

关注

评论

发布
暂无评论
发现更多内容

性能优化知多少

圣杰

sql 性能优化 dotnet

runtime笔记

Conan

ios

Linux入门篇 —— Shell详解

若尘

Linux 命令行 linux操作

阿里粗排技术体系与最新进展

DataFunTalk

移除数组中的数字,不用额外空间, 实战RxSwift中的Observable, subscribe, dispose, 吴军老师态度读后感 John 易筋 ARTS 打卡 Week 39

John(易筋)

ARTS 打卡计划 吴军的态度 态度读后感

阿里中间件团队技术官手撸笔记,全新演绎“Kafka部署实战”,已开源

Java架构之路

Java 程序员 架构 面试 编程语言

牛掰!面试不再慌,苦刷这份2020最全的“基础-中级-高级”面试题库,已涨17k

Java架构之路

Java 程序员 架构 面试 编程语言

一口气发布十大建网利器,华为打算煲出怎样的5G味道?

脑极体

简单的网站搭建

很甜回忆

网站

javascript中的内置对象和数据结构

程序那些事

JavaScript 数据结构 ES6 程序那些事

小程序开发-云开发技术总结

我是哪吒

小程序 程序员 大前端 28天写作 2月春节不断更

关于央行数字货币若干问题的思考 | 比较

CECBC

数字货币

基于grpc手撸一个RPC框架

cloudcoder

风口上的量子计算机:核聚变一样的赌局,钻石一样的骗局

脑极体

【计算机内功修炼】十:线程间到底共享了哪些进程资源

码农的荒岛求生

c c++ 线程 操作系统 进程

【2021海量真实校招】软件测试面试真题,(大数据整理)刷完应对各家企业面试完全没有问题!

程序员阿沐

面试 软件测试 自动化测试 黑盒测试 白盒测试

Selenium 利用 JS/JQ 操作元素、鼠标键盘事件、Cookie 操作

梦想橡皮擦

Python 28天写作 2月春节不断更 selenium

最新大厂Java面试题库,测试一下你能坚持到哪一面 “美团+字节+腾讯”三面技术问题

Java架构之路

Java 程序员 架构 面试 编程语言

深度丨从货币历史看比特币的诞生

CECBC

比特币

科大讯飞发布全新一代智能办公本X2

Lucien

Kalm——基于Kubernetes的部署工具

David

开源 Kubernetes DevOps 运维 运维平台

火山翻译:工业级应用与研究

DataFunTalk

热点浅谈:低代码开发平台发展前景与市场规模!

优秀

低代码 低代码开发 低代码开发平台

区块链电子合同存证,电子合同区块链服务平台

13530558032

诊所数字化:患者数字档案的价值机遇和风险

boshi

数字化医疗 七日更 28天写作

构建“金融+司法”新局面:兴业消费金融区块链电子存证系统正式上线

CECBC

金融

Elasticsearch 查询结果排序

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

解读云原生技术

xcbeyond

Kubernetes 云原生 服务网格 28天写作

一道好题!我觉得面试如果考察「双指针」的话,这题是刚刚好 ...

宫水三叶的刷题日记

面试 LeetCode 数据结构与算法

字节跳动面试官这样问消息队列:高可用、不重复消费、可靠传输、顺序消费、消息堆积,我整理了下

冰河

面试 分布式 中间件 消息队列 一起进大厂

优雅编程 | javascript代码优化的4个小技巧

devpoint

递归 命名空间 闭包 函数绑定

基于 CPU 的深度学习推理优化部署方案和实践_CNUTCon_张磊_InfoQ精选文章