【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

专访腾讯 AI Lab 副主任俞栋:优势和挑战让我选择腾讯

  • 2017-05-04
  • 本文字数:2014 字

    阅读完需:约 7 分钟

2017 年 5 月 2 日,腾讯宣布任命前微软研究院首席研究员,深度学习开源软件 CNTK 主要作者,语音识别技术顶级专家俞栋博士为 AI Lab(人工智能实验室)副主任,并成立美国西雅图 AI 实验室。他是腾讯为组建 AI Lab 挖来的又一员大将,此前机器学习及数据领域专家张潼博士也加盟担任 AI Lab 主任。

日前,俞栋博士接受 InfoQ 专访,回应了自己选择腾讯的重要原因,同时也解析了腾讯 AI Lab 语音识别领域未来研究发展的方向。

俞栋,1998 年加入微软公司,曾任微软研究院首席研究员,兼任浙江大学兼职教授和中科大客座教授,现任腾讯 AI Lab(人工智能实验室)副主任。语音识别和深度学习方向的资深专家,出版了两本专著,发表了 160 多篇论文,是 60 项专利的发明人及深度学习开源软件 CNTK 的发起人和主要作者之一。曾获 2013 年和 2016 年 IEEE 信号处理协会最佳论文奖。现担任 IEEE 语音语言处理专业委员会委员,曾担任 IEEE/ACM 音频、语音及语言处理汇刊、IEEE 信号处理杂志等期刊的编委。

腾讯 AI Lab 是一个刚刚成立,还在组建初期的实验室,为什么这样一个实验室可以吸引到俞栋博士这样的人才来加入,访谈中,俞栋博士给出了自己的答案:优势与挑战并存。他表示,腾讯已有的大数据基础成为了他研究的重要支撑,而他本人又是一个喜欢不断挑战困难的人,腾讯 AI Lab 成为了他新的选择。

作为一名研究人员,研究的方向很重要。俞栋博士在语音识别领域已经取得了不少的成就,而他加入腾讯之后也会继续在自己的领域发挥本领,对于未来长远的规划,他也有自己的考虑,他做了这样一个比喻:

如果你掉了一根针在地上,研究就是你寻找那根针的过程,不确定方向、不确定位置,所以很难估算时间。应用就是你捡起针的过程,因为知道了针的位置,要把它捡起来,要预估时间和工作量,就容易容易一些。
······
研究是一件并不是着急就能够成功的事情。如果要在技术研究上取得突破,确实需要有一定的耐心和相对来说长期稳定的投入。这也是西雅图实验室秉持的理念。

1998 年,俞栋博士开始在微软工作,2002 年进入微软研究院语音和对话组(Speech and Dialog Group),他一直把语音识别作为研究重点,也很有兴趣通过研究解决一些语音识别领域的关键问题,希望能给出更好的解决方案。

加入腾讯后,俞栋博士主要负责西雅图 AI 实验室的运营和管理,同时也会进一步推动腾讯在语音识别和自然语言理解等 AI 领域的基础研究。

关于选择腾讯的原因,俞栋博士曾经说过:“第一,语音识别必须有大数据来源,必须有大运算能力,必须有出口形成反馈机制进而优化产品,即一定要有落地的场景这三大发展。第二自己偏好研究,喜欢解决一些有挑战性的问题,其他的一些公司各有利弊,比如有产品但是缺研究。我看重的这些条件,腾讯都能够满足。”

腾讯在过去十多年里,积累了丰富的应用场景、海量数据、强大的计算能力和一流的科技人才,这些都是开展 AI 深度研究与应用的重要基础,对于语音识别更是尤其重要。没有数据的支持,基本上整个系统的性能都会受到很大的限制;而没有场景就没有了出口,无法形成反馈机制,也就不能不断优化语音识别技术。

作为语音识别领域的资深专家,俞栋博士已经取得了不俗的成就,然而困难总是不断出现,但正如他自己所说,自己是一个喜欢挑战困难的人。在他重点研究的语音识别和自然语言理解这两个方向,两方面的挑战在不断困扰同时也激励着他继续研究,在采访中他说:“一方面,如上面提到的,语音识别领域有一些关键问题还没有好的解决方案,我们想做这方面研究;另一方面,语音识别只是应用的一个环节,无论是文字还是语音等数据,大多需要进一步处理,这就需要用到自然语言理解(NLP)。这也是一个不太成熟的领域。所以我们希望先多花点精力在这两方面,看看能不能做得比现在的技术更好。”现在很多技术没办法真正落地,不是因为工程和应用能力不强,而是确实有一些基本的问题没有解决。这时有两种方案,等别人去解决,自己再学习解决方法,第二种是可以自己去尝试解决这些问题。AI Lab 现在就是希望在后者做一些尝试和探索。

之前的采访中,俞栋博士表示自己希望可以组建一个 20 人左右的团队进行研究,对于人才的挑选与培养,他保持着开放的心态,只要是 AI 相关领域一流人才,具有自我驱动力和雄心的博士研究员或科学家,有能力和有潜力的人才,都欢迎加入。但这并不代表他不重视人才的质量,他说:“我们会通过各种渠道去发现合适的人才,要有足够的耐心和诚意。”

最后,在团队的研究方向的问题上,俞栋博士提出了两个大方向:语音识别和语义理解。而对于研究时间的问题上,俞栋博士的表达很严谨:
“研究是一件并不是着急就能够成功的事情。如果要在技术研究上取得突破,确实需要有一定的耐心和相对来说长期稳定的投入。这也是西雅图实验室秉持的理念。我们希望长远来讲,能够攻克关键的技术难题,在真实应用场景里面有很大的性能提升。但是我们没有办法预测到底哪天会成功,所以希望在每一个阶段,都希望会有一些进步累积。”

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-05-04 20:202840
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 263.1 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

如何充分压榨一台EC2

申屠鹏会

Colibri for Mac(原生无损音频播放器) 2.1.9永久激活版

mac

苹果mac Windows软件 Colibri 音频播放器软件

Mini PCIe WiFi card SOC-QCA9880 vs. QCA9882: 802.11ac Dual-Band Wireless Chipset Sh

wifi6-yiyi

QCA9880 Mini PCIe WiFi card

PON网络应用场景

小魏写代码

为了 Vue 组件测试,你需要为每个事件绑定的方法加上括号吗?

OpenTiny社区

开源 Vue 前端 测试

21 天技术人写作行动营招募中

InfoQ写作社区官方

AI 写作 写作技巧 热门活动 活动预告

如何基于亚马逊云科技打造高性能的 SQL 向量数据库 MyScale

亚马逊云科技 (Amazon Web Services)

机器学习 深度学习 存储 Amazon EC2 向量数据库

在小红书认识不到一周,我和TA成为了同事

用友BIP

智能招聘

预发部署时机器总是重启两次的“简单”排查

阿里技术

部署 故障排查 排查 预发 重启

学习指南:如何快速上手媒体生态一致体验开发

HarmonyOS开发者

HarmonyOS

邀请报名|11月24日阿里云原生 Serverless 技术实践营 深圳站

Serverless Devs

云计算 Serverless AIGC 沙龙预告

你真的了解@Async吗? | 京东云技术团队

京东科技开发者

spring 注解 Async 企业号11月PK榜

MATLAB R2023b mac最新中文激活版资源

影影绰绰一往直前

微众银行 TiDB HTAP 和自动化运维实践

TiDB 社区干货传送门

实践案例

TiDB x 云盛海宏丨加速精细化运营,云海零售系统的架构演进

TiDB 社区干货传送门

实践案例

APM建设踩了哪些坑?去哪儿旅行分布式链路追踪系统实践

TakinTalks稳定性社区

主流的第三方直播SDK对比(腾讯云、即构、阿里云、声网、网易云信、网宿)

音视频开发_AIZ

实时音视频 直播技术 SDK测试 音视频开发 直播间

提升提测质量之研测共建 | 京东云技术团队

京东科技开发者

测试 研发 企业号11月PK榜

OpenCL任务调度基础介绍 | 京东物流技术团队

京东科技开发者

gpu 编程语言 企业号11月PK榜 OpenCL

基于数据中台的过程看板助力光伏单晶行业管理提升

用友BIP

数据中台

陈长城:NineData面向Doris实时数仓集成的技术实践

NineData

数据库 实时数仓 Doris 玖章算术 NineData

SCSS 进阶之道:探索更多样式表达的可能性

伤感汤姆布利柏

如何用AB测试完善产品激励体系

字节跳动数据平台

大数据 A/B 测试 对比实验

观测云产品更新 | 监控、图表、服务管理、单点登录、Pipeline 等优化

观测云

数据库 pipeline 单点登录

TiDB 在安信证券资产中心与极速交易场景的实践

TiDB 社区干货传送门

实践案例

四载磨砺,一群青年“识瘤者”以AI助力医疗创新

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 先锋开发者云上说

利用ETLCloud自动化流程实现业务系统数据快速同步至数仓

RestCloud

ETL

aiohttp - Python 异步 HTTP 客户端库入门教程

Liam

Python 编程 程序员 后端 aiohttp

利用 Kubernetes 降本增效?EasyMR 基于 Kubernetes 部署的探索实践

袋鼠云数栈

Kubernetes 运维 集群管理

专访腾讯AI Lab副主任俞栋:优势和挑战让我选择腾讯_腾讯_陈思_InfoQ精选文章