AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

从研究到落地:小米计算机视觉算法实用化探讨

  • 2019-08-27
  • 本文字数:788 字

    阅读完需:约 3 分钟

从研究到落地:小米计算机视觉算法实用化探讨

计算机视觉技术近些年发展迅速,特别是引入深度学习后,成熟的技术方向和可落地场景越来越多。对工程师来说,一个算法项目从建立到实用一般需要经历论文方法调研、数据采集、模型训练、算法优化和实用部署这些流程,而每年数千篇高水平论文的出现为工程师指出了比较明确的技术思路,但论文算法离实用还有比较大的距离,主要体现在效果无法覆盖广泛的场景,且效率很难满足落地要求等。


在即将到来的AICon全球人工智能与机器学习技术大会(北京站)2019上,我们邀请到了小米人工智能部 AI 实验室视觉组总监黄英老师,带来《从研究到落地:小米计算机视觉算法实用化探讨》的相关内容分享。


本演讲从小米公司实际案例出发,如新上线的魔法换天功能等,介绍了如何将核心算法落地实际场景,如何在精度和效率上进行调试优化,确保最终的用户体验。算法实用化过程中总会遇到很多困难点,遇到很多不好解决的 BadCase,效率上的优化也没有止境,这些都欢迎参会工程师一起探讨。

内容大纲

  • 背景介绍

  • 视觉算法落地流程

  • 落地案例分享

  • 难点和展望

听众收益

  • 成熟团队的算法研发流程

  • 从论文算法到落地一般会遇到哪些难点,如何解决

  • 深度学习算法和网络的一些优化经验


嘉宾介绍


黄英,小米公司人工智能部总监。2005 年清华大学电子工程系博士毕业,毕业后先后入职于中星微电子、三星通信研究院、阿里巴巴达摩院,2018 年加入小米公司。从 1999 年加入清华大学智能图文处理实验室开始,黄英一直从事图像处理、人脸识别、智能监控、深度学习等方向的算法研究应用和优化工作,有多项视觉算法在云端、嵌入式、SOC 芯片落地,在如何将算法研究与工程落地方面积累了丰富的经验。曾担任阿里云人脸识别和图像识别方向的技术负责人,现任小米人工智能部 AI 实验室视觉组总监,负责将人脸、画质、图像理解、视频分析、文本分析等多个视觉方向的算法落地于小米的多个产品线。


更多人工智能技术相关案例,欢迎点击AICon北京2019官网查看。


2019-08-27 16:322300

评论

发布
暂无评论
发现更多内容

读一篇博客,写一段代码,每天写写Python自然就会了,每日Python第1天

梦想橡皮擦

Python 3月月更

2022年中国个人云盘行业发展年度分析

易观分析

个人云盘

关于 CentOS 迁移龙蜥操作系统,这里有一份详细指南,请查收!

OpenAnolis小助手

centos 开源 操作系统 龙蜥

一个好的持续交付流水线是怎样的? | 研发效能提升36计

阿里云云效

云计算 阿里云 云原生 持续交付 持续部署

js几种网络请求方式梳理——摆脱回调地狱

有道技术团队

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

GPU算力

老牌软件厂商亚信科技加入,携手龙蜥社区共建开源生态

OpenAnolis小助手

开源 亚信科技 互联网社区

selenium的实现原理

红毛丹

自动化测试 自动化测试框架 selenium 3月程序媛福利 3月月更

DevOps流水线CI 成倍提速方案

八戒技术团队

DevOps

Web 键盘输入法应用开发指南 (4) —— 组合键

天择

JavaScript 键盘 输入法 3月月更

当TIME_WAIT状态的TCP正常挥手,收到SYN后…

华为云开发者联盟

TCP syn 报文 TIME_WAIT RST报文

网易智企发布“易+”开源计划,网易会议组件正式开源

网易云信

音视频 开发

Linux之ping命令

入门小站

Linux

简单说明一下数据库审计能带来的价值

行云管家

数据库 数据安全 数据库审计

深入浅出特征工程 -- 基于 OpenMLDB 的实践指南(下)

第四范式开发者社区

数据库 sql 人工智能「 特征 特征平台

为什么在数据驱动的路上,AB实验值得信赖?

字节跳动数据平台

字节跳动 数据分析 AB testing实战 ab测试

在线HTML转PUG工具

入门小站

工具

当渲染遇上边缘计算,打造视频交互新模式

火山引擎边缘云

云原生 边缘计算 实时渲染

今儿直白的用盖房子为例,给你讲讲Java建造者模式

华为云开发者联盟

Java 设计模式 对象 建造者模式 对象构建模式

TiDB Online DDL 在 TiCDC 中的应用丨TiDB 工具分享

PingCAP

恒源云(Gpushare)_【活动专区】已上线,没有最优只有更优

恒源云

人工智能 算法 服务器

selenium相对定位器

红毛丹

3月程序媛福利 3月月更

应对EAST 5.0新挑战!索信达推出灵矩全景式监管合规平台

索信达控股

数据治理 金融 监管平台 数智化 合规性

详解用OpenCV绘制各类几何图形

华为云开发者联盟

OpenCV 图像处理 图像 几何图形

ImageView变灰、倒影、圆角、加水印

逆锋起笔

android 图片处理 3月月更 imageView

【等级保护】等级保护共分为几级?保护对象是指什么?

行云管家

网络安全 等保 等级保护 等保2.0

什么是云效?通过云效体验一站式研发,实现10 倍效能提升

阿里云云效

阿里云 DevOps 云原生 研发效能 云效

面向体验,助推超视频时代新增长

字节跳动视频云技术团队

音视频开发

NFT商城游戏系统开发技术

薇電13242772558

NFT

大规模异构数据的线索列表进化之路

百度Geek说

后端

语音顶会 ICASSP 2022 成果分享:基于时频感知域模型的单通道语音增强算法

阿里云CloudImagine

阿里云 音频 论文 视频云 智能降噪

从研究到落地:小米计算机视觉算法实用化探讨_AI&大模型_黄英_InfoQ精选文章