写点什么

AI 赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫

  • 2019-07-31
  • 本文字数:2671 字

    阅读完需:约 9 分钟

AI赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫

本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。


本期Robin.ly AI 访谈特邀平安科技美国研究院院长韩玫博士,在美国长滩 CVPR 2019 会场分享她在计算机视觉领域的研究经历、以及平安研究院将 AI 技术应用于传统产业的商业化实践。


平安科技研究院是世界 50 强金融巨头平安集团的创新技术研究机构,覆盖金融、医疗、汽车、房产、智慧城市五大生态圈。韩玫博士拥有清华大学计算机科学技术博士、和卡内基·梅隆大学机器人学博士学位。她曾经担任美国 NEC 实验室研究员、Google 资深科学家,研究领域包括视频分析、视觉跟踪、物体检测、几何建模、图像处理、计算机视觉、多媒体处理以及计算机图形学。


下文为 Robin.ly 主持人 Wenli 与韩玫博士的访谈实录。

学术界与工业界合作

Wenli: 您是今年 CVPR 的企业关系主席。这个角色的责任是什么?


韩玫:


我两年前就做过这方面的工作。那一年是第一次把企业赞助和演示大规模地在 CVPR 做起来, 我们当时创纪录地获得了 100 家赞助商的支持,今年的规模要大很多很多。我的职责就是联系相关企业,在赞助企业与学术会议之间架起一座桥梁。


Wenli: 您如何看待您在学术界和工业界之间所建立合作?


韩玫:


我认为工业界和学术界的合作越来越紧密的根本原因是因为大数据时代需要两边的人共同合作推动行业发展。像谷歌和平安这样的大公司有大量的应用场景和数据,需要解决很多实际问题,而学术界的人能够帮助为这些问题提供解决方案。


Wenli: 您如何看待学术界和工业界的进步?哪一边的发展更快?


韩玫:


学术界和工业界的科研发展肯定是有区别的。我 1995 年开始在卡内基·梅隆大学(CMU)攻读博士学位,比较长期和理论的学术研究主要是在大学里进行;公司做的更多的是以业务为导向的研发。1997 年,我在微软研究院实习,2001 年加入美国 NEC 实验室。那时我们更专注于企业相关或业务驱动的工作。但现在学术界和工业界之间的界限变得更模糊了,学术界和工业界的人需要一起合作解决问题。


我们也看到了越来越多的教授和学生参与了工业界的研究工作。很多的教授会利用学术休假去工业界任职,让自己的学生去公司实习。大型企业也会赞助学术研究,比如 Google Cloud 会为学生提供免费的会员资格,让他们利用更高的计算能力实践自己的工作。

双博士研究经历

Wenli: 您拥有清华大学和 CMU 的双博士学位,有非常扎实的研究背景。您当时的博士研究课题是什么?毕业后为什么选择去工业界?


韩玫:


那时候还没有深度学习。我在 CMU 的博士论文做的是传统的 Structure from Motion (SfM) 方法研究。我毕业后选择进入工业界主要是因为在校园呆得太久了,我想将多年积累的知识和经验应用到工业界解决实际问题。工业界的实验室提供了学术研究和实际应用完美结合的机会。我先后加入了 NEC 美国实验室,谷歌和平安的实验室。在这三个公司的工作经历都让我受益匪浅。



韩玫在卡内基·梅隆大学,来源:韩玫


Wenli: 您在 CMU 的导师是计算机视觉领域的先驱,大名鼎鼎的 Takeo Kanade。他对您的职业发展产生了什么样的影响?


韩玫:


他工作非常努力,在六七十岁的高龄仍然会工作到深夜,包括节假日,很多年轻学生都没有他精力旺盛。他非常注重细节,会亲自检查我们的代码、论文和报告幻灯片,并提出建设性的建议。他总是喜欢挑战最难的事情,有一种不服输的精神。

计算机视觉现阶段的挑战

Wenli: 您如何看待计算机视觉领域近二十年的技术突破?当前面临的挑战是什么?平安的应对策略又是什么呢?


韩玫:


这是一个数据驱动的时代,大数据、深度学习和强算力,特别是计算机视觉领域借助李飞飞的 ImageNet,使得许多计算机视觉的传统问题有了新的解决方法和思路。


目前计算机视觉面临从感知到认知的过渡,以及知识的表达和学习。


从应用角度来看,当前行业面临的主要挑战就是如何通过大数据来真正理解现实世界。我认为很多问题都可以在一定程度上运用大数据和深度学习来解决。我们现在迫切需要可解释的人工智能技术,比如在金融和医疗的应用。这些传统领域的商务人士和医生真正关心的是大数据的工作原理,而不仅仅满足于把它当作一个“黑匣子”,知其然而不知其所以然。所以如果要应用这些技术到传统领域,让它们真正发挥作用,我们仍然需要剖析深度学习背后的理论、原则和数学依据。


平安一直很重视这个领域的研究。硅谷研究院也有短、中、长期的研究方向和目标。我们会利用平安多年积累的丰富的领域知识和经验,以及数据和场景,深耕深度学习的理论问题,比如可解释性、泛化能力、知识表达。


AI 技术商业化

Wenli: 能否介绍一下你们希望利用 AI 技术实现哪些商业应用?


韩玫:


平安的业务涵盖了许多不同的领域,如医疗、金融、智慧城市。举个例子,我们在进行一些视频内容理解和智慧教育相关的工作,针对学生和老师的课堂行为分析,对于每个学生、老师,每节课、每个知识点,在多个维度整合统计数据,帮助孩子们更好地学习和老师更好地教学,做到真正地因材施教。同时可以把优秀的教学范例推广到师资缺乏的偏远地区,造福更多的学生和学校。


我们也从事英语口语教育方面的研究,通过评估孩子的英语词汇量、交流语速以及发音是否准确这些细节信息来帮助孩子们提高口语能力。


在计算机视觉领域,我们有多个图像和视频处理相关的项目。其中一个主要的项目是打造农业监督工具。我们使用遥感技术和卫星图像来监测农作物的长势,估算产量和预测灾害带来的损失,帮助农民更好地管理和规划耕种。我们利用 NDVI 数据,即多光谱图像数据实现作物识别和产量预测,最大的困难是大量的数据标注的要求。这个获得真实准确标注的过程就体现了平安,作为一个传统行业和农业保险提供者的先天优势。平安农险的同事会根据 NDVI 数据的分析结果,收集、整理、获取、采样不同地理位置、环境、光谱等的实地信息,这个标注本身就具有巨大的商业和科研价值,对于推动遥感影像技术的研发和应用,对于造福农业社区,都有深远的意义。



Wenli: 你们下一步的计划和长期目标是什么?


韩玫:


明年我们计划把研究院的规模从 30 名研究人员扩大到 40 到 50 人,专注于计算机视觉和语音文本的研究。平安硅谷研究院在建立之初,就设定了两大使命:一是推动人工智能技术的发展,二是赋能平安的主要业务。


我们的长期目标是建立一流的工业界研究院。背靠平安强有力的支持,我们有决心深耕核心技术,建立长远的研发目标,助力研究社区的发展,同时服务于来自平安内外的业务合作伙伴,他们的业务需求会阶段性地驱动和验证我们的研发成果,我们可以矫正和确定我们在朝着正确的方向努力。


原文链接:


https://www.robinly.info/post/mei-han-director-ping-an-technology-corporate-relations-chair-cvpr-2019


2019-07-31 08:004428
用户头像
Robin.ly 硅谷AI科技、创业、领导力访谈

发布了 49 篇内容, 共 19.8 次阅读, 收获喜欢 59 次。

关注

评论

发布
暂无评论
发现更多内容

波司登云原生微服务治理探索

阿里巴巴云原生

阿里云 微服务 云原生

累计下载破 10 万,阿里云 ACR 制品中心 5 月最受欢迎镜像排行榜

阿里巴巴云原生

阿里云 阿里云云原生 容器镜像服务

火山引擎DataLeap的Catalog系统搜索实践 (二):整体架构

字节跳动数据平台

元数据 catalog DataLeap 文档检索

速来!TDengine 六周年线上生日趴,“送”周边大礼包啦

爱倒腾的程序员

时序数据库 ​TDengine taosdata

软件测试/测试开发丨Web自动化测试常见控件交互方法

测试人

共建、共享开源EDA共性技术框架 | 2023开放原子全球开源峰会开源EDA分论坛即将启幕

开放原子开源基金会

开源 EDA 开放原子

海量数据运维要给力,GaussDB(for Cassandra)来助力

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 6 月 PK 榜

常用的表格检测识别方法——表格结构识别方法 (下)

合合技术团队

人工智能 深度学习 文字识别 表格检测

【活动回顾】Databend 数据库表达式框架设计与实现 @GOTC

Databend

探索云原生技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会云原生分论坛即将启幕

开放原子开源基金会

开源 云原生

索信达“数据资产管理解决方案”全解析

索信达控股

SeaTunnel毕业!首个国人主导的数据集成项目成为Apache顶级项目

Apache SeaTunnel

大数据 开源 数据集成 国产开源 Apache SeaTunnel

一分钟跑出 AI 图像的生成平台

CODING DevOps

AI Cloud Studio 云端IDE

对线面试官-线程池(二)

派大星

Java 面试题

英特尔持续耕耘锐炫显卡:累计21次驱动更新,支持XeSS游戏达50+

E科讯

百度商业AI技术创新大赛火热进行中,携手专家大咖一起创新为更好!

百度Geek说

人工智能 AIGC 企业号 5 月 PK 榜

从Google、创业再到字节跳动,我在开源领域的实践与思考

开源雨林

创业 字节跳动 开源治理

中核集团财务共享迈上新台阶

用友BIP

财务共享

Arm NN 成功适配 openEuler Embedded,提供高性能神经网络推理能力

openEuler

Linux 操作系统 openEuler risc-v embedded

凝心聚力,共创未来 | 2023 开放原子全球开源峰会 OpenCloudOS 社区年会即将启幕

开放原子开源基金会

开源 云原生技术 OpenCloudOS 社区

看数智平台如何助力企业实现产业互联

用友BIP

数智平台

软件测试/测试开发丨Selenium Web浏览器控制

测试人

程序员 软件测试 自动化测试 测试开发

火山引擎A/B测试:MAB智能调优实验,企业活动效果提升新利器

字节跳动数据平台

AB testing实战 A/B 测试

云原生数据库厂商拓数派加入龙蜥社区,打造多样化的数据底座

OpenAnolis小助手

开源 操作系统 龙蜥社区 CLA 拓数派

Flink CEP 在抖音电商的业务实践|电商行业实践专栏上线

Apache Flink

大数据 flink 实时计算

支持神经滤镜Photoshop 2023 (ps 2023)Mac v24.5/24.6b中文激活

真大的脸盆

Mac Mac 软件 ps神经滤镜 photoshop神经滤镜

AI赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫_AI&大模型_Robin.ly_InfoQ精选文章