Data+AI时代,如何打造下一代数智平台? 了解详情
写点什么

嵌入式深度学习框架研发与落地实践

  • 2019-09-17
  • 本文字数:732 字

    阅读完需:约 2 分钟

嵌入式深度学习框架研发与落地实践

AICon北京2018大会上,李永会讲师做了《嵌入式深度学习框架研发与落地实践》主题演讲,主要内容如下。


演讲简介


深度学习技术已经在互联网的诸多方向产生影响。该技术近几年在嵌入式领域也得到飞速发展,各种互联网产品都争相在端侧应用深度学习技术,产品对深度学习的引入也将进一步影响用户体验。随着移动设备被广泛使用,在移动互联网产品应用深度学习和神经网络技术已经成为必然趋势。


在移动端应用深度学习技术时往往存在各种各样的问题,由于移动端设备的性能以及包体积、耗电、内存都有很大的局限,这就为深入全面落地相关技术框架带来了很大难度。本次演讲主要从硬件面对的困难讲起,再到落地应用层面的问题解决,以简单搜索 App 为案例全面讲解从汇编到顶层架构实现。


演讲提纲:


  1. 移动端 AI 现状

  2. Paddle-Mobile 介绍

  3. Paddle-Mobile CPU 性能优化

  4. CPU 优化落地简单搜索 APP 场景案例

  5. Paddle-Mobile GPU 性能优化

  6. GPU 优化落地简单搜索 APP 场景案例

  7. FPGA、NPU 等协处理器方案

  8. Paddle-Mobile 硬件支持架构描述

  9. 简单搜索创新体验介绍


听众收益:


  1. 从中可以了解到当下移动端 AI 框架的格局和发展情况

  2. Paddle-Mobile 做为百度移动端唯一深度学习框架的 ARM CPU 和 Mali\Andreno GPU 的性能优化

  3. 对体系结构和硬件知识也可以有一定的深入了解


讲师介绍


李永会


百度 多模搜索部资深工程师


百度大搜索客户端架构师,主要研究方向是嵌入式方向超算性能挑战,对于 Andreno GPU 和 Mali GPU 以及 ARM CPU 投入较多精力研究。目前负责图像搜索相关技术工作,主持移动端深度学习框架 Paddle-Mobile 的研发工作。重点关注嵌入式领域的硬件和体系结构相关研究。工作成果在百度 APP 和简单搜索 APP 多个大型线上 APP 应用。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-17 13:591727

评论

发布
暂无评论
发现更多内容
嵌入式深度学习框架研发与落地实践_AICon_李永会_InfoQ精选文章