嵌入式深度学习框架研发与落地实践

阅读数:129 2019 年 9 月 17 日 13:59

嵌入式深度学习框架研发与落地实践

AICon 北京 2018 大会上,李永会讲师做了《嵌入式深度学习框架研发与落地实践》主题演讲,主要内容如下。

演讲简介

深度学习技术已经在互联网的诸多方向产生影响。该技术近几年在嵌入式领域也得到飞速发展,各种互联网产品都争相在端侧应用深度学习技术,产品对深度学习的引入也将进一步影响用户体验。随着移动设备被广泛使用,在移动互联网产品应用深度学习和神经网络技术已经成为必然趋势。

在移动端应用深度学习技术时往往存在各种各样的问题,由于移动端设备的性能以及包体积、耗电、内存都有很大的局限,这就为深入全面落地相关技术框架带来了很大难度。本次演讲主要从硬件面对的困难讲起,再到落地应用层面的问题解决,以简单搜索 App 为案例全面讲解从汇编到顶层架构实现。

演讲提纲:

  1. 移动端 AI 现状
  2. Paddle-Mobile 介绍
  3. Paddle-Mobile CPU 性能优化
  4. CPU 优化落地简单搜索 APP 场景案例
  5. Paddle-Mobile GPU 性能优化
  6. GPU 优化落地简单搜索 APP 场景案例
  7. FPGA、NPU 等协处理器方案
  8. Paddle-Mobile 硬件支持架构描述
  9. 简单搜索创新体验介绍

听众收益:

  1. 从中可以了解到当下移动端 AI 框架的格局和发展情况
  2. Paddle-Mobile 做为百度移动端唯一深度学习框架的 ARM CPU 和 Mali\Andreno GPU 的性能优化
  3. 对体系结构和硬件知识也可以有一定的深入了解

讲师介绍

李永会

百度 多模搜索部资深工程师

百度大搜索客户端架构师,主要研究方向是嵌入式方向超算性能挑战,对于 Andreno GPU 和 Mali GPU 以及 ARM CPU 投入较多精力研究。目前负责图像搜索相关技术工作,主持移动端深度学习框架 Paddle-Mobile 的研发工作。重点关注嵌入式领域的硬件和体系结构相关研究。工作成果在百度 APP 和简单搜索 APP 多个大型线上 APP 应用。

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

嵌入式深度学习框架研发与落地实践

完整演讲 PPT 下载链接

https://aicon.infoq.cn/2018/beijing/#schedule

评论

发布