写点什么

嵌入式深度学习框架研发与落地实践

  • 2019-09-17
  • 本文字数:732 字

    阅读完需:约 2 分钟

嵌入式深度学习框架研发与落地实践

AICon北京2018大会上,李永会讲师做了《嵌入式深度学习框架研发与落地实践》主题演讲,主要内容如下。


演讲简介


深度学习技术已经在互联网的诸多方向产生影响。该技术近几年在嵌入式领域也得到飞速发展,各种互联网产品都争相在端侧应用深度学习技术,产品对深度学习的引入也将进一步影响用户体验。随着移动设备被广泛使用,在移动互联网产品应用深度学习和神经网络技术已经成为必然趋势。


在移动端应用深度学习技术时往往存在各种各样的问题,由于移动端设备的性能以及包体积、耗电、内存都有很大的局限,这就为深入全面落地相关技术框架带来了很大难度。本次演讲主要从硬件面对的困难讲起,再到落地应用层面的问题解决,以简单搜索 App 为案例全面讲解从汇编到顶层架构实现。


演讲提纲:


  1. 移动端 AI 现状

  2. Paddle-Mobile 介绍

  3. Paddle-Mobile CPU 性能优化

  4. CPU 优化落地简单搜索 APP 场景案例

  5. Paddle-Mobile GPU 性能优化

  6. GPU 优化落地简单搜索 APP 场景案例

  7. FPGA、NPU 等协处理器方案

  8. Paddle-Mobile 硬件支持架构描述

  9. 简单搜索创新体验介绍


听众收益:


  1. 从中可以了解到当下移动端 AI 框架的格局和发展情况

  2. Paddle-Mobile 做为百度移动端唯一深度学习框架的 ARM CPU 和 Mali\Andreno GPU 的性能优化

  3. 对体系结构和硬件知识也可以有一定的深入了解


讲师介绍


李永会


百度 多模搜索部资深工程师


百度大搜索客户端架构师,主要研究方向是嵌入式方向超算性能挑战,对于 Andreno GPU 和 Mali GPU 以及 ARM CPU 投入较多精力研究。目前负责图像搜索相关技术工作,主持移动端深度学习框架 Paddle-Mobile 的研发工作。重点关注嵌入式领域的硬件和体系结构相关研究。工作成果在百度 APP 和简单搜索 APP 多个大型线上 APP 应用。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-09-17 13:591466

评论

发布
暂无评论
发现更多内容

改善CRM系统策略的方法

低代码小观

CRM 客户关系管理 企业管理系统 CRM系统 客户关系管理系统

深入微服务-服务注册与发现 SpringCloud Eureka之基础

janyxe

微服务 云原生 SpringCloud Eureka 服务注册与发现

Squids DBMotion数据库迁移服务上线|助力云端数据畅游无阻!

沃趣科技

直播回顾 | 后疫情时代,食品行业破局秘籍get一下!

旺链科技

区块链 溯源 产业区块链

DeFi挖矿智能合约Dapp系统开发搭建

薇電13242772558

智能合约

墨天轮访谈 | 京东云曲艺伟:京东零售核心业务背后的数据库实践

墨天轮

数据库 京东云 国产数据库

茶饮市场当前情况如何?走入下半场的现制茶战局,又将去向何方?

易观分析

茶饮

【FinClip 黑客马拉松优秀参赛项目@灰鲸疫情地图】疫情之下,安全出行的一站式解决方案

FinClip

finclip FinClip Hackthon 疫情地图

性能提升 57% ,SMC-R 透明加速 TCP 实战解析 | 龙蜥技术

OpenAnolis小助手

互联网 网络协议 高性能 TCP/IP 龙蜥技术

云计算和运维工程师冲突吗?运维岗需要云计算知识吗?

行云管家

云计算 运维 IT运维 云运维

用更云原生的方式做诊断|大规模 K8s 集群诊断利器深度解析

尔达Erda

程序员 运维 云原生 k8s 工具

Neo 生态技术月报 | 助力开发者玩转智能合约

TinTinLand

区块链

Wallys/ AR9531/WiFi Card/ MMCX

wallys-wifi6

AR9531 30dBm high power

fastposter v2.8.1 发布 电商海报生成器

物有本末

Python Pillow fastposter fast-poster

时间堆原理详解及C++11的实现

C++后台开发

后端开发 Linux服务器开发 C++11 C++后台开发 时间堆

当我们谈论服务质量的时候,我们在谈什么?

VoltDB

5G QoS 电信运营商

超潜力公链DFINITY——DeFi 开发者最佳进入时期

TinTinLand

区块链

【直播回顾】如何成为一名优秀的OpenHamrony贡献者?

OpenHarmony开发者

OpenHarmony 贡献代码

移动端异构运算技术-GPU OpenCL 编程(基础篇)

百度Geek说

后端

当开放服务网格 OSM 遇到 Pipy

Flomesh

Service Mesh 服务网格 SMI OSM

前端路由工作原理与使用

CRMEB

Hoo网格策略 | 一「网」在手 告别「追涨杀跌」

区块链前沿News

虎符 Hoo 网格交易

【LeetCode】爬楼梯的最少成本Java题解

Albert

算法 LeetCode 5月月更

AI简报:图像超分模型 EDSR+RDN

AIWeker

人工智能 5月月更 超分 AI简报

设计模式关系图(全网首发)之行为模式

设计模式

《方博碳讨室》:四问欧洲绿色能源转型

Geek_2d6073

云数赋能+数字办公 助力政企数字化

浪潮云

AIRIOT物联网低代码平台如何配置欧姆龙omron驱动?

AIRIOT

低代码 物联网 驱动配置

“晕乎乎的概念”:阿里云函数计算的“应用”又是个啥

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

首届 FinClip Hackathon 圆满落幕,亚马逊云科技|云服务平台助力获奖团队高速成长

FinClip

亚马逊 finclip FinClip Hackthon

堡垒机属于什么设备?是网络设备吗?

行云管家

网络安全 服务器 堡垒机 网络设备

嵌入式深度学习框架研发与落地实践_AICon_李永会_InfoQ精选文章