AI 赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫

阅读数:1557 2019 年 7 月 31 日

本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。

本期 Robin.ly AI 访谈特邀平安科技美国研究院院长韩玫博士,在美国长滩 CVPR 2019 会场分享她在计算机视觉领域的研究经历、以及平安研究院将 AI 技术应用于传统产业的商业化实践。

平安科技研究院是世界 50 强金融巨头平安集团的创新技术研究机构,覆盖金融、医疗、汽车、房产、智慧城市五大生态圈。韩玫博士拥有清华大学计算机科学技术博士、和卡内基·梅隆大学机器人学博士学位。她曾经担任美国 NEC 实验室研究员、Google 资深科学家,研究领域包括视频分析、视觉跟踪、物体检测、几何建模、图像处理、计算机视觉、多媒体处理以及计算机图形学。

下文为 Robin.ly 主持人 Wenli 与韩玫博士的访谈实录。

学术界与工业界合作

Wenli: 您是今年 CVPR 的企业关系主席。这个角色的责任是什么?

韩玫:

我两年前就做过这方面的工作。那一年是第一次把企业赞助和演示大规模地在 CVPR 做起来, 我们当时创纪录地获得了 100 家赞助商的支持,今年的规模要大很多很多。我的职责就是联系相关企业,在赞助企业与学术会议之间架起一座桥梁。

Wenli: 您如何看待您在学术界和工业界之间所建立合作?

韩玫:

我认为工业界和学术界的合作越来越紧密的根本原因是因为大数据时代需要两边的人共同合作推动行业发展。像谷歌和平安这样的大公司有大量的应用场景和数据,需要解决很多实际问题,而学术界的人能够帮助为这些问题提供解决方案。

Wenli: 您如何看待学术界和工业界的进步?哪一边的发展更快?

韩玫:

学术界和工业界的科研发展肯定是有区别的。我 1995 年开始在卡内基·梅隆大学(CMU)攻读博士学位,比较长期和理论的学术研究主要是在大学里进行;公司做的更多的是以业务为导向的研发。1997 年,我在微软研究院实习,2001 年加入美国 NEC 实验室。那时我们更专注于企业相关或业务驱动的工作。但现在学术界和工业界之间的界限变得更模糊了,学术界和工业界的人需要一起合作解决问题。

我们也看到了越来越多的教授和学生参与了工业界的研究工作。很多的教授会利用学术休假去工业界任职,让自己的学生去公司实习。大型企业也会赞助学术研究,比如 Google Cloud 会为学生提供免费的会员资格,让他们利用更高的计算能力实践自己的工作。

双博士研究经历

Wenli: 您拥有清华大学和 CMU 的双博士学位,有非常扎实的研究背景。您当时的博士研究课题是什么?毕业后为什么选择去工业界?

韩玫:

那时候还没有深度学习。我在 CMU 的博士论文做的是传统的 Structure from Motion (SfM) 方法研究。我毕业后选择进入工业界主要是因为在校园呆得太久了,我想将多年积累的知识和经验应用到工业界解决实际问题。工业界的实验室提供了学术研究和实际应用完美结合的机会。我先后加入了 NEC 美国实验室,谷歌和平安的实验室。在这三个公司的工作经历都让我受益匪浅。

韩玫在卡内基·梅隆大学,来源:韩玫

Wenli: 您在 CMU 的导师是计算机视觉领域的先驱,大名鼎鼎的 Takeo Kanade。他对您的职业发展产生了什么样的影响?

韩玫:

他工作非常努力,在六七十岁的高龄仍然会工作到深夜,包括节假日,很多年轻学生都没有他精力旺盛。他非常注重细节,会亲自检查我们的代码、论文和报告幻灯片,并提出建设性的建议。他总是喜欢挑战最难的事情,有一种不服输的精神。

计算机视觉现阶段的挑战

Wenli: 您如何看待计算机视觉领域近二十年的技术突破?当前面临的挑战是什么?平安的应对策略又是什么呢?

韩玫:

这是一个数据驱动的时代,大数据、深度学习和强算力,特别是计算机视觉领域借助李飞飞的 ImageNet,使得许多计算机视觉的传统问题有了新的解决方法和思路。

目前计算机视觉面临从感知到认知的过渡,以及知识的表达和学习。

从应用角度来看,当前行业面临的主要挑战就是如何通过大数据来真正理解现实世界。我认为很多问题都可以在一定程度上运用大数据和深度学习来解决。我们现在迫切需要可解释的人工智能技术,比如在金融和医疗的应用。这些传统领域的商务人士和医生真正关心的是大数据的工作原理,而不仅仅满足于把它当作一个“黑匣子”,知其然而不知其所以然。所以如果要应用这些技术到传统领域,让它们真正发挥作用,我们仍然需要剖析深度学习背后的理论、原则和数学依据。

平安一直很重视这个领域的研究。硅谷研究院也有短、中、长期的研究方向和目标。我们会利用平安多年积累的丰富的领域知识和经验,以及数据和场景,深耕深度学习的理论问题,比如可解释性、泛化能力、知识表达。

AI 技术商业化

Wenli: 能否介绍一下你们希望利用 AI 技术实现哪些商业应用?

韩玫:

平安的业务涵盖了许多不同的领域,如医疗、金融、智慧城市。举个例子,我们在进行一些视频内容理解和智慧教育相关的工作,针对学生和老师的课堂行为分析,对于每个学生、老师,每节课、每个知识点,在多个维度整合统计数据,帮助孩子们更好地学习和老师更好地教学,做到真正地因材施教。同时可以把优秀的教学范例推广到师资缺乏的偏远地区,造福更多的学生和学校。

我们也从事英语口语教育方面的研究,通过评估孩子的英语词汇量、交流语速以及发音是否准确这些细节信息来帮助孩子们提高口语能力。

在计算机视觉领域,我们有多个图像和视频处理相关的项目。其中一个主要的项目是打造农业监督工具。我们使用遥感技术和卫星图像来监测农作物的长势,估算产量和预测灾害带来的损失,帮助农民更好地管理和规划耕种。我们利用 NDVI 数据,即多光谱图像数据实现作物识别和产量预测,最大的困难是大量的数据标注的要求。这个获得真实准确标注的过程就体现了平安,作为一个传统行业和农业保险提供者的先天优势。平安农险的同事会根据 NDVI 数据的分析结果,收集、整理、获取、采样不同地理位置、环境、光谱等的实地信息,这个标注本身就具有巨大的商业和科研价值,对于推动遥感影像技术的研发和应用,对于造福农业社区,都有深远的意义。

Wenli: 你们下一步的计划和长期目标是什么?

韩玫:

明年我们计划把研究院的规模从 30 名研究人员扩大到 40 到 50 人,专注于计算机视觉和语音文本的研究。平安硅谷研究院在建立之初,就设定了两大使命:一是推动人工智能技术的发展,二是赋能平安的主要业务。

我们的长期目标是建立一流的工业界研究院。背靠平安强有力的支持,我们有决心深耕核心技术,建立长远的研发目标,助力研究社区的发展,同时服务于来自平安内外的业务合作伙伴,他们的业务需求会阶段性地驱动和验证我们的研发成果,我们可以矫正和确定我们在朝着正确的方向努力。

原文链接:

https://www.robinly.info/post/mei-han-director-ping-an-technology-corporate-relations-chair-cvpr-2019

收藏

评论

微博

发表评论

注册/登录 InfoQ 发表评论