小米AI这一年

2020 年 11 月 10 日

小米AI这一年

“手机×AIoT”双引擎战略下,小米AI 加速。

明年再扩招 5000 名工程师,小米加速储备人才


小米在招揽人才上再使出 “大招”。


近日,雷军在小米 2020 年小米开发者大会上宣布,小米在 2021 年将在十大领域扩招 5000 名工程师,占小米目前员工总数的 20%以上。


“人才是创新之源,提升技术实力的第一步,就是聚拢最顶尖的人才”,雷军表示,小米目标创造最好的工作环境,以激发工程师的创造力和创新力。“未来十年,我的愿望之一就是,要继续努力将小米打造成工程师们向往的圣地”。


小米在招人上一直不遗余力。雷军以相机技术部门举例,2018 年相机部成立时工程师只有 122 人,目前相机部工程师已达 826 人,增长了近 6 倍,这还不包括 AI 实验室为相机提供技术支持的 350 多位工程师。小米相机研发中心的选址也主要以人才聚集地作为主要考虑因素。目前,小米已在北京、巴黎、东京、圣地亚哥等城市设立了九地研发中心,共设立 5 个国际研发中心。


今年受到疫情"黑天鹅"影响,不少互联网公司减少或者关闭招聘编制。但小米启动了创业以来规模最大的校园招聘。2020 年,小米共入职了 2252 名大学生,其中研究生学历达 1470 人。


这两年,小米 AI 引入了不少学术界、业界的重量级人才。2018 年 8 月,中科院研究员王斌博士加盟小米,出任小米 NLP 首席科学家,负责自然语言处理基础平台的构建及前沿技术的探索与创新。2019 年 2 月,小米进行组织架构调整,王斌被任命为人工智能部 AI 实验室主任,负责推动 AI 技术的预研和落地。同年 11 月,语音识别大牛 Kaldi 之父 Daniel Povey 博士加入小米,出任小米语音首席科学家,将负责开发下一代 Kaldi 。


上周,根据全球三大知名调研机构的数据,小米在全球智能手机市场的份额重回世界第三。这是继小米在 2014 年后再次回归全球第三。雷军认为,这次回归是 6 年来积极补课、夯实基础的结果,也反映了小米过硬的技术实力。


雷军提到,今年小米今年研发投入将超过 100 亿元,研发投入在科创板所有上市公司研发成本总和的一半,在所有上市和未上市的高科技公司中,也能进入前 20。他表示,小米未来还会继续死磕硬核科技。小米还将在相机、屏幕、充电、IoT、智能制造等多个领域继续加强研发投入。


“手机×AIoT”战略下,小爱同学 5.0 版本 5 大升级


小米集团副总裁、技术委主席崔宝秋博士在开发者大会上发布了四大新技术:小爱同学 5.0 升级;新一代 Kaldi;物联网软件平台 Xiaomi Vela;开放三大系统影像能力,包括手机影像能力向第三方 APP 开放,手机影像处理能力为 IoT 设备赋能,复眼分布式相机开放协议。


小爱同学 5.0 将产品定位从语音助手升级为智能生活助手,这一变化是顺应小米战略升级做出的。今年 8 月,小米公布了新战略 — “手机×AIoT”战略来构建智能生活。为配合该战略,小爱同学进行了相应的升级,她现在不只是语音助手,还覆盖了在智能生活上的方方面面,希望降低用户使用智能产品的门槛。


小爱同学 5.0 共有五大升级,包括全场景智能协同、对话式主动智能、多模态融合交互、个性化情感声音和智慧学习助手。其中,全场景智能协同包括了协同唤醒、协同响应和协同提醒,能对家庭中的家居基于用户的意图进行统一决策,多设备协同配合,用户不用担心多设备协作配合的问题,小爱同学降低了使用智能设备的负担。


在引导对话方面,小米人工智能部副总经理、小爱同学研发总负责人王刚博士在接受 InfoQ 等媒体采访时表示,小爱同学开发了对话式主动智能,会用比较自然的对话方式,更主动与用户进行交互,在 UI 交互上不打扰用户,在对话过程中,小爱会主动抛出一些带有用户专属信息的话题与用户沟通,拉近与用户的距离,和用户亲近地打招呼,关怀提醒。在 5.0 版本中发布了“个性化动态语音识别”、“协同唤醒”等多项自研技术,新版本的小爱同学在语音交互上理解更准确,对话更加自然。


据悉,截止 6 月 30 日,小爱同学累计唤醒次数达 617 亿次,全球激活设备数 2.28 亿,小爱同学月活跃用户达到 7840 万。


小米 AI 的 2020


小米 AI 实验室主任、NLP 首席科学家王斌介绍了小米 AI 技术在过去一年来的进展与应用。


王斌表示,小米 AI 需求主要来自于公司内部,包括硬件产品、电商及新零售、互联网服务等“铁人三项”业务。


基于此需求,小米的 AI 战略分为两个部分,一是打造核心 AI 能力,二是通过开放合作建立合作关系,并将技术输送给社会。


小米 AI 目前已经建立了比较完整的技术图谱。



王斌详细介绍了小米在计算机视觉、语音、声学、NLP、知识图谱、机器学习等 AI 技术方面的进展。


在计算机视觉方面,大的突破主要来自 HDR/超级夜景、超级分辨率、文档/OCR、魔法换天、魔法分身、Vlog 等技术。HDR 技术助力小米手机今年两次荣登 DXOMARK 评测相机拍照第一名。


语音技术近一年的成果主要体现在唤醒、识别、生成和声纹技术等方面。声学在手机降噪、阵列唤醒、分布式放音、评测等方面取得了很大进展。声学、语音技术广泛落地到小爱同学以及手机、电视、音箱等产品。


在知识图谱技术上,小米在知识问答,智能坐席辅助、智能外呼、客服机器人等技术获得多项创新。


小米在机器学习方面近一年的成果主要包括,推出了面向微处理器的深度学习推理框架 MACE Micro,打造了面向广告推荐的自研稀疏模型自动优化架构 AutoSparseDL,进一步完善深度学习云服务平台 CloudML 等等。


在自然语音处理技术方面,小米自然语言处理平台 MiNLP 平台最新版 3.0 版发布,包括 26 个模块,落地 30 多个业务,目前 MiNLP 每天调用 80 亿次。抗噪机器翻译、统一机器翻译技术取得进展,目前已经落地手机、小爱同学等业务。在多模态内容理解方面,能够联合文本、语音、视频进行联合分析,已落地信息流、广告等业务。人机对话上,改写回复、生成式对话,多样性回复等技术已应用在小爱同学的闲聊技能上。对联、诗歌写作等技术已经落地到小米多个业务中,得到了很好的反馈。


值得一提的是,MiNLP 平台后续准备开源。


小米集团副总裁、技术委员会主席崔宝秋在开发者大会现场发布了 MiNLP 平台开源计划,MiNLP 的分词功能将于 11 月中下旬正式对外开源,词性标注功能将于明年一季度开源,命名实体识别功能将于明年二季度开源,语义相关功能将于明年三季度开源。



王斌介绍说,开源的 NLP 工具主要源自学术界或者工业界。来自学术界的开源 NLP 工具一般会侧重考虑学术实验场景,能为对学术研究带来很大的帮助。而来自工业界的开源工具,则倾向于考虑实际应用场景。目前业内一些公司诸如百度、腾讯等也都开源了一些 NLP 工具。


王斌介绍,小米 MiNLP 平台来自业务需求的驱动,更倾向于实际落地场景。不少模块自上线以来历经多个工业界实际上线场景的考验,小米开源的就是这个经历过考验的最新版本。


谈到与学术界和工业界已开源工具的区别,王斌博士表示,小米 MiNLP 在设计时充分借鉴了已有工具的一些思想和理念,并根据小米的实际经验进行了区别性设计,有自己的一些特点。比如,工业界最有力的干预机制,小米事先在设计时靠考虑到框架的灵活性,不用重新训练模型,就能方便地支持有效的干预机制。这样,用户就可以很灵活地将自己的东西放上去,并在短时间内获得一个更符合线上需求的版本。


目前,小米 AI 应用中的大部分核心技术以自主研发为主导,这些技术已经全面赋能到小米的各个产品和业务线。


谈到小米人工智能的未来,小米人工智能部总经理叶航军博士表示,小米 AI 已有了比较明确的短期目标和长期目标。


短期目标目前有两个大方向,一个是 AI 产品和小爱同学要支持好小米的智能生活战略,即“手机×AIoT”构建智能生活的战略。因为在这个战略中,小爱同学是非常重要的环节,可以认为,她发挥的是一个入口和落地的作用。另一个是 AIOT 方向,这六大技术方向现在都有非常明确的业务和落地场景。现在大家对 AI 的期望很高,其实它有非常多的技术问题解决得还很不好。这是小米后面要努力把这个事情做好的一个决心。


长期目标也主要有 2 个,一个是要把各个环节的智能化做的更深入一些。 现在很多环节其实并不智能,在整个小米的业务体系里面,需要把各个层面的智能做得很深入。除了用户可见的产品体验以外,还有一些不太容易注意得到的场景,比如客服也是需要智能的。现阶段用户对客服的体验可能还不太好,大部分客服的问题其实是相对比较简单的问题,对目前的 AI 来说,都是能解决的问题。因此,针对这个方面,小米也在加大投入。


第二个长期目标是,往产业的上游去做。例如,小米将智能制造作为非常重要的场景。除了向消费者直接提供产品之外,小米也希望通过技术来帮助整个国内的制造业提升制造水平,智能制造里非常重要的技术就是 AI 技术。


2020 年 11 月 10 日 17:383173
用户头像
刘燕 InfoQ记者

发布了 470 篇内容, 共 146.9 次阅读, 收获喜欢 829 次。

关注

评论 1 条评论

发布
用户头像
我好像找到我的xiaomi电视上传流量大于下载流量的原因了
2020 年 11 月 16 日 14:46
回复
没有更多评论了
发现更多内容

目标检测综述

Dreamer

Forsage矩阵系统开发,智能合约搭建

薇電13242772558

独立显卡市场又一巨头跻入,英特尔锐炬® Xe MAX 独立显卡来了!

intel001

Docker底层技术

混沌畅想

Docker 容器 DevOps 底层技术

SpringBoot-技术专题-war包部署读取外部配置Properties

李浩宇/Alex

C++ primer -- 第16章 string类和标准模版库

Dreamer

c++

写文档太麻烦,试试这款 IDEA 插件吧!

程序员小航

Java markdown IDEA idea插件 文档

EDA最强攻略,如何为EDA选择存储?

焱融科技

分布式 高性能 存储 半导体 EDA

MySQL中事务的持久性实现原理

X先生

MySQL 数据库 sql 数据库事务 事务

永续合约系统开发源码,合约跟单软件搭建app

WX13823153201

数据结构与算法系列之链表操作全集(二)(GO)

书旅

go 数据结构 算法

一个研发团队是如何坚持7年技术分享的?

PingCode

团队管理 敏捷开发 研发管理 技术分享 程序员节

TensorFlow 篇 | TensorFlow 数据输入的最佳实践

Alex

tensorflow keras input pipeline dataset

接口测试人员需要掌握的知识技能

测试人生路

接口测试

TypeScript魔法堂:函数类型声明其实很复杂

肥仔John

Java typescript

C++ primer -- 第18章 探讨C++新标准

Dreamer

c++

架构师训练营第 1 期 第 5 周作业

李循律(祥龙)

极客大学架构师训练营

面试时说Redis是单线程的,被喷惨了!

云流

redis 编程 程序员 计算机

华为云的销售凭什么说“赢”了罗振宇?

ToB行业头条

tob

专利申请其实并不难?四步教你玩转专利申请!

华为云开发者社区

专利 保护

Caffe 安装踩坑记录

Dreamer

caffe

架构师训练营第 1 期 第 3 周作业

李循律(祥龙)

极客大学架构师训练营

直播预告 | CloudQuery初体验——安装及多数据源连接

CloudQuery社区

数据库 sql 安全 工具软件 dba

C++ primer -- 第17章 输入,输出和文件

Dreamer

c++

架构师训练营 1 期第 6 周作业

木头发芽

在2020年更受关注和追捧的JS框架

Geek_Willie

react.js Vue js Svelte

当下工作流管理系统的发展趋势

Marilyn

敏捷开发 快速开发 软件架构 企业开发

SpringBoot-技术专题-war包部署读取外部配置Yml

李浩宇/Alex

快速掌握并发编程---深入学习ThreadLocal

田维常

基于React+Koa实现一个h5编辑器

徐小夕

Java nodejs H5 React koa

试用阿里网盘内测版-不限速、无广告、隐私安全我全都要

郭旭东

阿里云网盘

小米AI这一年-InfoQ