2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

AI 赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫

  • 2019-07-31
  • 本文字数:2671 字

    阅读完需:约 9 分钟

AI赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫

本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。


本期Robin.ly AI 访谈特邀平安科技美国研究院院长韩玫博士,在美国长滩 CVPR 2019 会场分享她在计算机视觉领域的研究经历、以及平安研究院将 AI 技术应用于传统产业的商业化实践。


平安科技研究院是世界 50 强金融巨头平安集团的创新技术研究机构,覆盖金融、医疗、汽车、房产、智慧城市五大生态圈。韩玫博士拥有清华大学计算机科学技术博士、和卡内基·梅隆大学机器人学博士学位。她曾经担任美国 NEC 实验室研究员、Google 资深科学家,研究领域包括视频分析、视觉跟踪、物体检测、几何建模、图像处理、计算机视觉、多媒体处理以及计算机图形学。


下文为 Robin.ly 主持人 Wenli 与韩玫博士的访谈实录。

学术界与工业界合作

Wenli: 您是今年 CVPR 的企业关系主席。这个角色的责任是什么?


韩玫:


我两年前就做过这方面的工作。那一年是第一次把企业赞助和演示大规模地在 CVPR 做起来, 我们当时创纪录地获得了 100 家赞助商的支持,今年的规模要大很多很多。我的职责就是联系相关企业,在赞助企业与学术会议之间架起一座桥梁。


Wenli: 您如何看待您在学术界和工业界之间所建立合作?


韩玫:


我认为工业界和学术界的合作越来越紧密的根本原因是因为大数据时代需要两边的人共同合作推动行业发展。像谷歌和平安这样的大公司有大量的应用场景和数据,需要解决很多实际问题,而学术界的人能够帮助为这些问题提供解决方案。


Wenli: 您如何看待学术界和工业界的进步?哪一边的发展更快?


韩玫:


学术界和工业界的科研发展肯定是有区别的。我 1995 年开始在卡内基·梅隆大学(CMU)攻读博士学位,比较长期和理论的学术研究主要是在大学里进行;公司做的更多的是以业务为导向的研发。1997 年,我在微软研究院实习,2001 年加入美国 NEC 实验室。那时我们更专注于企业相关或业务驱动的工作。但现在学术界和工业界之间的界限变得更模糊了,学术界和工业界的人需要一起合作解决问题。


我们也看到了越来越多的教授和学生参与了工业界的研究工作。很多的教授会利用学术休假去工业界任职,让自己的学生去公司实习。大型企业也会赞助学术研究,比如 Google Cloud 会为学生提供免费的会员资格,让他们利用更高的计算能力实践自己的工作。

双博士研究经历

Wenli: 您拥有清华大学和 CMU 的双博士学位,有非常扎实的研究背景。您当时的博士研究课题是什么?毕业后为什么选择去工业界?


韩玫:


那时候还没有深度学习。我在 CMU 的博士论文做的是传统的 Structure from Motion (SfM) 方法研究。我毕业后选择进入工业界主要是因为在校园呆得太久了,我想将多年积累的知识和经验应用到工业界解决实际问题。工业界的实验室提供了学术研究和实际应用完美结合的机会。我先后加入了 NEC 美国实验室,谷歌和平安的实验室。在这三个公司的工作经历都让我受益匪浅。



韩玫在卡内基·梅隆大学,来源:韩玫


Wenli: 您在 CMU 的导师是计算机视觉领域的先驱,大名鼎鼎的 Takeo Kanade。他对您的职业发展产生了什么样的影响?


韩玫:


他工作非常努力,在六七十岁的高龄仍然会工作到深夜,包括节假日,很多年轻学生都没有他精力旺盛。他非常注重细节,会亲自检查我们的代码、论文和报告幻灯片,并提出建设性的建议。他总是喜欢挑战最难的事情,有一种不服输的精神。

计算机视觉现阶段的挑战

Wenli: 您如何看待计算机视觉领域近二十年的技术突破?当前面临的挑战是什么?平安的应对策略又是什么呢?


韩玫:


这是一个数据驱动的时代,大数据、深度学习和强算力,特别是计算机视觉领域借助李飞飞的 ImageNet,使得许多计算机视觉的传统问题有了新的解决方法和思路。


目前计算机视觉面临从感知到认知的过渡,以及知识的表达和学习。


从应用角度来看,当前行业面临的主要挑战就是如何通过大数据来真正理解现实世界。我认为很多问题都可以在一定程度上运用大数据和深度学习来解决。我们现在迫切需要可解释的人工智能技术,比如在金融和医疗的应用。这些传统领域的商务人士和医生真正关心的是大数据的工作原理,而不仅仅满足于把它当作一个“黑匣子”,知其然而不知其所以然。所以如果要应用这些技术到传统领域,让它们真正发挥作用,我们仍然需要剖析深度学习背后的理论、原则和数学依据。


平安一直很重视这个领域的研究。硅谷研究院也有短、中、长期的研究方向和目标。我们会利用平安多年积累的丰富的领域知识和经验,以及数据和场景,深耕深度学习的理论问题,比如可解释性、泛化能力、知识表达。


AI 技术商业化

Wenli: 能否介绍一下你们希望利用 AI 技术实现哪些商业应用?


韩玫:


平安的业务涵盖了许多不同的领域,如医疗、金融、智慧城市。举个例子,我们在进行一些视频内容理解和智慧教育相关的工作,针对学生和老师的课堂行为分析,对于每个学生、老师,每节课、每个知识点,在多个维度整合统计数据,帮助孩子们更好地学习和老师更好地教学,做到真正地因材施教。同时可以把优秀的教学范例推广到师资缺乏的偏远地区,造福更多的学生和学校。


我们也从事英语口语教育方面的研究,通过评估孩子的英语词汇量、交流语速以及发音是否准确这些细节信息来帮助孩子们提高口语能力。


在计算机视觉领域,我们有多个图像和视频处理相关的项目。其中一个主要的项目是打造农业监督工具。我们使用遥感技术和卫星图像来监测农作物的长势,估算产量和预测灾害带来的损失,帮助农民更好地管理和规划耕种。我们利用 NDVI 数据,即多光谱图像数据实现作物识别和产量预测,最大的困难是大量的数据标注的要求。这个获得真实准确标注的过程就体现了平安,作为一个传统行业和农业保险提供者的先天优势。平安农险的同事会根据 NDVI 数据的分析结果,收集、整理、获取、采样不同地理位置、环境、光谱等的实地信息,这个标注本身就具有巨大的商业和科研价值,对于推动遥感影像技术的研发和应用,对于造福农业社区,都有深远的意义。



Wenli: 你们下一步的计划和长期目标是什么?


韩玫:


明年我们计划把研究院的规模从 30 名研究人员扩大到 40 到 50 人,专注于计算机视觉和语音文本的研究。平安硅谷研究院在建立之初,就设定了两大使命:一是推动人工智能技术的发展,二是赋能平安的主要业务。


我们的长期目标是建立一流的工业界研究院。背靠平安强有力的支持,我们有决心深耕核心技术,建立长远的研发目标,助力研究社区的发展,同时服务于来自平安内外的业务合作伙伴,他们的业务需求会阶段性地驱动和验证我们的研发成果,我们可以矫正和确定我们在朝着正确的方向努力。


原文链接:


https://www.robinly.info/post/mei-han-director-ping-an-technology-corporate-relations-chair-cvpr-2019


2019-07-31 08:004599
用户头像
Robin.ly 硅谷AI科技、创业、领导力访谈

发布了 49 篇内容, 共 20.9 次阅读, 收获喜欢 60 次。

关注

评论

发布
暂无评论
发现更多内容

QA视角看数据匿名化

BY林子

数据安全 测试右移 用户数据 数据脱敏

【LeetCode】区域和检索 - 数组不可变Java题解

Albert

算法 LeetCode 28天写作

技术解析 | Doris Compaction机制解析

百度开发者中心

百度 apache doris

华为云原生数据仓库GaussDB(DWS)深度技术解读:融、快、大、稳、易

华为云开发者联盟

数据库 云原生 华为云 GaussDB 数仓

Linux入门篇 —— Linux 磁盘管理之磁盘理论篇

若尘

Linux linux编程 磁盘

GaussDB(DWS):非侵入式备份及其在NBU上的应用

华为云开发者联盟

架构 GaussDB 集群 备份 NBU

程序员之禅(一)

每天读本书

读书笔记

华为云举办AI经典论文复现活动,打造领先AI开发者学习社区

华为云开发者联盟

AI 华为云 modelarts 论文 AI Gallery

MongoDB 在评论中台的实践

vivo互联网技术

数据库 mongodb 分布式 集群

极限编程技术实践

Teobler

敏捷 敏捷开发 TDD 重构 极限编程

从0到1建立数据分析指标体系底层逻辑

小飞象@木木自由

数据分析 数据指标 数据分析体系

MySQL字段默认值设置详解

Simon

MySQL 数据库

树莓派上的家庭监控中心

冯骐

运维 树莓派 监控系统 Open-Falcon 物联网,

搭建一个 802.1x 的 web 测试服务

冯骐

网络 监控系统 Open-Falcon radius eduroam

国产芯片WiFi物联网智能插座—电耗采集功能设计

不脱发的程序猿

28天写作 国产芯片 电耗检测 电压电流 华大MCU

LeetCode题解:123. 买卖股票的最佳时机 III,动态规划,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

Wiki.js 配置 LDAP 认证

东风微鸣

wiki

海豚调度dolphinscheduler SQL脚本初始化流程

cloudcoder

海豚调度 调度引擎 分布式任务调度

Git学习游戏化,从Learn Git Branching 开始

程序老王

git 学习 学习方法 git 学习

山东青岛推进平安小区建设!源中瑞智慧社区平台解决方案

源中瑞-龙先生

解决方案 山东 源中瑞 青岛 智慧社区

元宵节元宵钱,不买元宵买云资源! | 2核4G低至0.79元/天

京东科技开发者

云主机 云服务器 云存储 云硬盘

刷屏洗脑的“吗咿呀嘿”,到底是个啥?

架构精进之路

商业模式 28天写作 3月日更

树莓派上的温湿度环境监控

冯骐

运维 树莓派 物联网 监控告警

看完你就明白什么是图神经网络

华为云开发者联盟

神经网络 深度学习 节点 图神经网络 图结构

程序员专属“灯谜”大挑战,答对六题算你赢!

京东科技开发者

编程语言 集群

构建一套适合微服务的高可用架构

环信

工作两三年了,整不明白架构图都画啥?

小傅哥

Java 后端 小傅哥 架构设计 画架构图

使用 pyVmomi 采集 vSphere 监控指标

冯骐

Python 运维 监控 Open-Falcon vpshere

技术案例 | 云原生微服务落地难?百度自用CRM这样做

百度开发者中心

微服务 CRM #百度智能云#

OS命令--shell中数组的操作

cloudcoder

数组 Shell 循环引用

EEPROM CAT24CXX实现分页读、写数据

不脱发的程序猿

28天写作 CAT24C08 EEPROM 嵌入式软件 单片机

AI赋能传统行业:知其然并知其所以然,专访平安科技美国研究院院长韩玫_AI&大模型_Robin.ly_InfoQ精选文章