阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

快手 AI 引擎幕后“推手”刘霁:跨越学界和业界的青年创新领袖

  • 2019-07-22
  • 本文字数:3574 字

    阅读完需:约 12 分钟

快手AI引擎幕后“推手”刘霁:跨越学界和业界的青年创新领袖

本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。


本期Robin.ly CVPR 2019 专题访谈特邀国民短视频平台“快手”的西雅图 AI 实验室和 FeDA 智能决策实验室主任、美国罗彻斯特大学助理教授刘霁博士,在美国长滩 CVPR 大会现场分享他在深度学习领域的研究成果、以及带领快手研发团队推动 AI 技术商业化的实践经历。


刘霁博士的研究领域包括机器学习、优化和强化学习,以及各类数据驱动的应用场景。他对利用技术解决图像分析、游戏人工智能设计、视觉理解等方面的实际问题也很感兴趣。他提出的异步并行算法(Asynchronous Parallel Algorithm)已应用于许多机器学习平台,如 Google TensorFlow。2018 年,他当选 MIT Technology Review 评选的“35 位 35 岁以下创新青年”。


下文为 Robin.ly 主持人 Margaret Laffan 与刘霁博士的访谈实录。

投身深度学习 开发前沿算法

主持人:我知道你是机器学习、优化和强化学习方面的专家。你当初为什么选择机器学习领域,特别是一开始就选择了深度学习优化相关的研究?


刘霁:


机器学习研究的是一种方法论,研究如何解决通用性的数据驱动问题,可以为多种应用问题提供实践工具和方法支持,如计算机视觉、自然语言处理、语音等等。我觉得掌握这些通用的工具和方法论,将来可以做的事情更多,视野可以更大,所以选择了机器学习作为研究方向。


这也是我当初选择深度学习优化这个切入点的原因。希望能参与解决当前最核心同时又相当有挑战的问题。众所周知,深度学习是一项非常强大的技术,目前也非常受欢迎。每天有相当多的研究者在不断的运行深度学习模型。如果我们加快这个过程到原来的十分之一,那么每个人都可以在这项工作中节省 90%的时间。所以深度学习优化是一项基础能力,决定了一个公司 AI 落地以及从算法模型到产品迭代效率。


主持人:我知道你在异步并行算法创新上取得了很多成绩,你开发的技术已经被 TensorFlow 和 PyTorch 采用。作为 MIT 评选的中国 35 岁以下的创新者之一,你创建了异步去中心并行随机梯度下降算法(asynchronous decentralized parallel stochastic gradient descent algorithm, AD-PSGD)。能介绍一下这个算法对研究开发领域的贡献吗?


刘霁:


我首先想讲一点,优化算法设计研究者和算法实现工程师之间确实存在很大的信息不对等。优化人员理解算法,但他们所了解的关于硬件部署的知识相对有限,因此当他们设计算法时,从实现角度考虑得相对较少,往往只是从收敛性和计算复杂度来指导算法设计。但对于部署工程师,他们需要把算法实现到 CPU、GPU 甚至 FPGA 等硬件上,但是在算法方面的知识却可能有限。所以这中间有一个真空地带。我的工作就是努力填补这一空白,进行联合优化,优化算法和硬件、优化性能、优化训练流程。这就是这项工作的目的和主要贡献。


我们在异步和去中心化方面都做的一些先驱性的工作其实就是看到这个真空。希望把真正运行效率当作标准来指导算法设计。异步并行方法能够解决传统同步并行算法中的瓶颈问题,也就是快机需要等待慢机。异步并行方法相比同步的方法有时候要快上一倍以上。另外,我们提出的去中心化并行框架相比于传统中心化的方法,可通过避免额外的计算量来有效缓解信息交通拥堵的情况。异步和去中心化都是加速深度学习训练过程的重要工具,这两种新技术打破了传统的做法,可以让机器学习算法更准确和高效,同时显着降低了同步的成本。目前,这两项技术已逐渐开始广泛应用于主流工具,比如 TensorFlow 和 PyTorch。我们相信这一进步可以填补优化算法和算法实现的间的真空地带,会对整个行业带来更多的推进和收益。



中心化和去中心化图示,图片来源:论文《Asynchronous Decentralized Parallel Stochastic Gradient Descent》

学术界和工业界相辅相成

主持人:你已经担任了五年的助理教授,同时也是公司的研究科学家。你为什么会选择同时跨越学术界和工业界?


刘霁:


很有意思的问题。实际上,很多人都问过我类似的问题。我认为这两个领域的经验对我的职业生涯都非常重要。在学术界,通常是深入地研究一个艰深的学术问题,考验的是在一个点上突破的能力;而在工业界,需要完整的解决一个实际问题,考验的更多是全面的能力和综合素质。这是两种完全不同的体验,对我的成长都具有非凡的意义。


另外值得指出一点就是,学术界通常关心解决一类问题,所以研究的问题讲求通用性和一般性。但是有时候容易脱离实际,学术界解决的问题有时候在工业界看来并不是真正的痛点。而工业界的问题在于过分关注于个体的问题,不重视把具体问题抽象成有价值的研究问题。所以容易出现重复造轮子的现象。


所以学界和业界是两个不同的群体,但他们可以相辅相成。从学术角度来看,我们可以将这个特定问题扩展成一个抽象问题,而这个抽象问题在某些意义上已经在学术界得到了很好的研究,我们可以应用现有技术或开发新技术来解决该问题。与此同时,我们可以帮助业界人士了解工业问题背后的数学基础和原理。但这并不意味着我们从学界学到的技能毫无用处。相反,这些技能有可能发挥非常重要的作用,但这取决于我们如何使用这些技能。我的目标就是尽力让学术界和工业界之间形成一个良好的过渡地带。

AI 技术的商业化实践


刘霁在 CVPR2019“快手”展示区讲解,图片来源:快手


主持人:我们来谈谈快手。你在 2018 年底加入快手,在接下来的三到五年里,你和公司都有什么样的计划?


刘霁:


设立快手西雅图 lab 的初衷是帮助解决公司业务中最重要的、有挑战的问题,同时为公司打造和沉淀核心的 AI 基础能力,比如像机器学习平台、小样本学习等等。同时有机会也希望开创一些新的业务增长。快手有良好的用户生态。现在的产品种类还不是很丰富,我们的工作重心相对还比较集中。未来三到五年,相信我们的产品矩阵会越来越丰富,每个人都有更大的发挥空间。


从个人的角度来讲,我自己有一套解决问题的方法论。我希望能在接下来的时间里实践和完善我的方法论。更明确一点讲,我是一个以问题为导向,以产品为导向的人。我很了解人工智能技术,但我还不够了解用户,如何合理得定义产品。为了在人工智能技术落地,我想先了解我们的用户,从而设计出最好的产品。我们可以通过设计算法,开发新技术,定义新的概念和流程来达到这个目的。


主持人:你目前在西雅图担任人工智能实验室和 FeDA(智能决策)实验室的主任。能给我们介绍一下 FeDA 实验室的使命和研究重点吗?


刘霁:


正如我前面提到的,设立快手 FeDA 联合实验室的目的是帮助解决商业化中最重要的、有挑战的的技术问题,例如 AI 对商业化赋能。商业化是公司去年启动的的一个重大项目,主要是研究如何向用户推荐视频广告,合理地发掘商业价值,最大化用户的体验。我们在快手有两组用户,一组会分享视频,另一组只观看视频,但是这两组人之间存在很大的重叠。公司的原则是同时为这两类人服务。但我们都知道,广告有时可能会损害用户的体验,那么挑战就在于如何最大限度的减少对用户的负面影响,最大化他们的正面体验。所以我们就需要开发更好的算法来进行个性化推荐。这部分也与计算机视觉领域研发人员密切相关。因为在快手,所有广告都是基于视频的。在传统的推荐问题中,需要处理的内容通常是文本或者图片,但是基于视频的新形式需要新技术,需要聘用新员工,这也是我参加各大计算机视觉会议的原因。



用户在 CVPR2019 现场体验,图片来源:快手


主持人:你谈到了用户体验和用户价值的。我们知道这对于产品创新非常重要。你能从快手的角度介绍一下这一点在产品开发的过程中是如何体现的吗?


刘霁:


快手确实非常关心用户体验。我理解公司将用户体验放在第一位,而商业化是第二位的。从我们的首席执行官和首席技术官到整个公司的每一名员工都达成了这样的共识。因此,无论我们做任何事情,都需要去了解用户体验方面的情况。这是一个复杂的数据分析任务,需要人工智能才能理解。人类是一个非常复杂的系统,使用纯粹或单一理论来解释人类的思维和感受是非常困难的,即便是心理学也不见总能得出正确的结论。我们必须结合不同领域的专业知识来了解我们的用户,这就是为什么我们最近在快手成立了一个新的团队专门进行统计分析。该团队的一个重要目标就是尝试了解人类行为以及对我们的产品是否满意。


主持人:在这个新的岗位上,你是如何管理团队的?你的领导风格是什么?


刘霁:


我认为我的领导风格是动态的,需要适应团队的需要。在某个阶段,比如现在,我的管理风格会更加中心化,因为公司正在成长,我们希望加快增长的速度,所以更需要中心化的管理方式。但我理想的管理方案是去中心化的。就好比教练和球员,球员除了需要与教练沟通,他们之间更需要直接的沟通和协同,才能更高效的发挥团队的力量。


主持人:说得太好了。我们期待你们能一步步实现最终的目标。再次感谢你!


原文链接:


https://www.robinly.info/post/cvpr-2019-ai-talk-prof-ji-liu-director-kuaishou-seattle-ai-lab-feda-lab


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-07-22 08:005600
用户头像
Robin.ly 硅谷AI科技、创业、领导力访谈

发布了 49 篇内容, 共 18.1 次阅读, 收获喜欢 59 次。

关注

评论

发布
暂无评论
发现更多内容

使用 ABAP 编程语言的 System CALL 接口,直接执行 ABAP 服务器所在操作系统的 shell 命令

Jerry Wang

Linux unix SAP abap 8月月更

web前端培训课程怎么选择

小谷哥

《数字经济全景白皮书》银行业智能营销应用专题分析 发布

易观分析

金融 银行 白皮书 智能营销

StratoVirt 中的虚拟网卡是如何实现的?

openEuler

开源 openEuler Open Source 内核态 虚拟网卡

看漫画MHGmhgui,Python爬虫之神奇的eval,附赠一个压缩模块

梦想橡皮擦

Python 爬虫 8月月更

集群部署spark、Hadoop环境

峥岳

hadoop spark hive

研发需求的验收标准应该怎么写? | 敏捷实践

LigaAI

程序员 产品经理 敏捷开发 研发管理 开发流程

程序员的专属浪漫——用3D Engine 5分钟实现烟花绽放效果

HMS Core

七日算法先导(六)——堆排序,桶排序

工程师日月

8月月更

美的数字化平台 iBUILDING 背后的技术选型

TDengine

数据库 tdengine database

java培训中心有哪些

小谷哥

富媒体在客服IM消息通信中的秒发实践

得物技术

前端 即时通讯 客服 富媒体 大文件传输

自从我使用HiFlow场景连接器后,在也不用担心成为“落汤鸡”了

叶秋学长

Hiflow

七日算法先导(七)——字符串

工程师日月

8月月更

API接口是什么?API接口常见的安全问题与安全措施有哪些?

郑州埃文科技

API接口管理 非对称加密 md5 令牌桶算法

国际计费系统基于Sharding-Proxy大数据迁移方案实践

京东科技开发者

数据库 系统 数据迁移

一文看懂大数据生态圈完整知识体系

博文视点Broadview

对话跨国消费品牌DPO:数据安全合规从何做起?8.11直播见!

奇点云

数据治理 数据安全 数据合规

浅谈一线互联网大厂中算法岗的分类

码农鬼仔

数据挖掘 AI 算法工程师 校招 机器学习/深度学习

electron 应用开发优秀实践

vivo互联网技术

前端 Web Electron 桌面开发

OpenSSF的开源软件风险评估工具:Scorecards

SEAL安全

开源 开源安全 软件供应链安全 开源合规 开源工具包

java软件培训费用怎么算

小谷哥

收到人生第一笔五位数工资

Amazing_eve

#开源

前端该如何优雅地 Mock 数据

CRMEB

MySQL传统方案和通过SSH连接哪个好?

了不起的程序猿

MySQL 数据库 java程序员 :MySQL 数据库

你知道 Vue scoped 原理吗?这波你在第几层?

掘金安东尼

面试 前端 8月月更

在北京参加UI设计培训到底怎么样?

小谷哥

MySQL索引的B+树到底有多高?

转转技术团队

MySQL 索引

人物 | 从程序员到架构师,我是如何快速成长的?

安势信息

程序员 职场 架构师 程序员进阶 人物访谈

开源一夏 |最好用的脚本语言--JavaScript

叶秋学长

开源 前端 js 8月月更

大数据培训课程如何选?

小谷哥

快手AI引擎幕后“推手”刘霁:跨越学界和业界的青年创新领袖_AI&大模型_Robin.ly_InfoQ精选文章