写点什么

专访腾讯小知陈松坚:知识表示是 NLP 乃至 AI 发展的瓶颈

  • 2018-12-26
  • 本文字数:2702 字

    阅读完需:约 9 分钟

专访腾讯小知陈松坚:知识表示是NLP乃至AI发展的瓶颈

人工智能领域有这样一句名言:解决了 NLP 的难题,也就解决了 AI 领域 80%的问题。从对话机器人 Eliza 开始,人们就对“会说话的机器”出奇的着迷,随着人工智能技术的进步,越来越多的人投身自然语言处理(NLP)的研究中,为了开发出智能、易用的对话机器人而不懈努力着。


几个月前,AI 前线策划了一篇文章,题为《都说聊天机器人已死,为什么腾讯还要打造自己的智能客服?》,在这篇文章中,我们曾深入讨论过智能客服 / 问答产品和 NLP 技术的技术难点、解决思路、商业化落地的途径和未来发展,在极客邦科技主办的全球人工智能与机器学习技术大会:AICon 2018 上,我们有幸再次专访到腾讯数据平台部高级算法研究员陈松坚,除了对他本人的技术研发之路有了更深的了解,陈松坚也与我们分享了许多有关 NLP 发展瓶颈以及技术趋势的看法。

入坑 NLP,一不小心深耕十年

自然语言处理被称为人工智能皇冠上的明珠,为了它,无数研究人员为之辛勤钻研,陈松坚就是这其中的一员。2009 年,还是研究生的陈松坚选择了 NLP 作为自己的研究方向。为了这个选择,他与自己作了一番斗争。


从当时比较现实的角度看,算法或许更好就业,于是陈松坚选择了机器学习、NLP、计算机视觉、数据挖掘等几个方向作为备选。至于为什么最终选择 NLP,陈松坚说,主要是因为考虑自己当时对搜索引擎比较关注,尤其是智能搜索技术;而从理想的角度想,他说自己从小比较喜欢机器人,一直有个梦想开始建造自己的机器人系统,而 NLP 是其中的不可或缺的部分,于是也就自然地做出选择了。


兜兜转转过了十年,陈松坚也早已成长为一名专业的研发人员,但是手里的工作还是转回到了 NLP 相关的项目上来——即腾讯小知,他开玩笑的说:或许是内心的召唤让自己重回智能对话这个研究领域。

小知是如何炼成的?

对于大部分对话机器人的研究人员来说:人类是如何产生认知并且与外部进行交互是一个永恒的课题,对于陈松坚来说自然是不例外,他认为:深度学习的兴起使得语音和图像识别的错误率大大降低,感知的问题得到了很大程度的解决。但是认知的问题,目前可以说还没有本质上的进步,原因就是那个永恒的课题。



“语言是思维的外化,研究语言的理解和产生,就是想借此推动认知智能的发展。”陈松坚补充道:“当然这需要一个迭代的过程,也需要一个场景去实践和落实这些想法, 于是我们选择了智能客服这个商业场景,去打造企业服务中的智能问答服务,输出价值。”


陈松坚说,智能问答中有很多方面都可以进行深入研究。


比如,基础层可以做深度语义匹配模型核心组件的进一步优化,还有开发问答拒识模型,用于过滤当前问答库无法回答的问题;应用层可以做强化学习在多轮任务机器人的应用,主要用于进行对话策略的在线学习。据了解,目前小知团队已经成功开发了若干个特定任务的 demo,正在准备正式部署到线上使用。


说回陈松坚深度参与的腾讯小知项目。


小知是从去年 7 月开始启动研发的智能客服系统,经历 1 年多的核心功能打造,现已落地多个应用,日均回答百万量级。在之前的采访中,陈松坚曾说:小知目前落地在政务、零售、服务等多个行业,上线时间仅 2 个月,已落地了数套成熟行业解决方案,成长势头很好。


虽然长势喜人,但说起小知的成长历程,陈松坚还是发出了一声感叹:万事起头难。


他解释道,在小知刚起步的时候,团队里对深度匹配模型的经验较少,而又由于业务上线的进度比较紧迫,因此选择双线作战,一边开发基于传统机器学习模型(xgboost)的线上系统,另一边进行深度语义匹配模型的论文复现,调优和工程实践。


考虑到 SaaS 场景下用户能够提供的训练语料非常欠缺,陈松坚和团队因此特地引入了迁移学习的策略来对应解决语料不足的问题。事实证明这些安排和策略都取得不错的效果。


能够带领小知的算法团队,从零开始一步一步地建设这种面向行业的智能问答解决方案,让陈松坚倍感欣慰,一方面需要快速响应业务的需求,快速实现和上线新功能,切实解决客户提出的问题;另一方面又必须紧跟业界和学界最新的技术,并积极寻求实施落地的路径,陈松坚说,从个人角度来说,这是最有成就感的事情。


从业近十年,陈松坚也积累了大量的实践经验,在采访中他也毫不吝啬地将这些经验分享给了有同样困扰地开发者:


他认为对于开发者来说,首先,要尽早搞清楚业务的需求,不同行业的问答解决方案很可能会涉及到不同的技术点,而且不同的业务场景对准确率指标的要求也不一样,这个也会影响算法落地的侧重点。比如小知最早接入的公安行业,知识库就特别复杂,分支条件很多,因此需要大量使用知识图谱来补全 FAQ 机器人的问答死角。


第二,要注意测评数据集的准确构建,尤其是线上环境的测试数据的收集,需要保证线下实验能对齐模型在线上环境的效果。另外就是跟业务关联的评价体系的构建,这样才能朝着正确的方向,稳定地迭代优化。

NLP 如何突破瓶颈?

智能客服是非常综合的 AI 系统,几乎涉及 NLP 领域所有技术点,甚至还包括语音和图像的处理。但人们对技术往往短期期望过高,而长期期望过低。虽然近年来 NLP 应用,尤其是翻译,写作,对话机器人等,在模型增强和知识图谱建设完善的过程中,在特定的场景下,满足了大部分人的使用需求,但是,在陈松坚看了,NLP 仍有一些瓶颈问题需要解决。



他说:AI 领域目前解决的问题,使用的都是模式识别的方法。进一步解释的话,就是通过大量的训练数据去找到数据内里的模式,然后再应用到实际数据的识别上,比如说语音的识别,图像的识别等,对应的是感知智能。


而 NLP 问题往往需要更高级的方法,因为在语言理解中涉及到大量的上下文,而除了一般意义的语言上下文,更重要的是外部知识上下文。这对应的就是认知智能的范畴,即如何帮助机器人构建概念世界,并作用到 NLP 的处理过程中。


陈松坚比喻说:“我认为对知识表示的建模,是目前 NLP 乃至 AI 技术发展的瓶颈,如果是 NLP 是皇冠上的明珠,那知识表示就是其中最大的一颗。”


他解释道,目前的知识都是基于符号表示的,比如知识图谱是利用了图节点来表示概念,关联边来表示概念之间的关系,但总的来说还是一个符号系统,所以的操作还是符号的检索和匹配,而跟当前的深度神经网络模型没办法有机结合。


所以,他本人与研发团队思考的方向也是诸如:是否可以将所有概念和关系都利用深度学习技术向量化,以及如何将规则也使用模型表示等问题。


强化学习在多轮对话中的应用也是陈松坚重点关注的技术趋势,主要是在特定场景下进行对话策略的学习,例如订票订餐任务,商品推荐等。他认为,目前主流的任务机器人都是基于槽位填充的方法,对话策略主要基于事先约定的规则,不够灵活,而强化学习可以通过结合端到端模型来实现对话策略的灵活调整,并且能够实现在线学习,使得多轮对话模型可以持续优化。


2018-12-26 14:432365
用户头像
陈思 InfoQ编辑

发布了 584 篇内容, 共 307.9 次阅读, 收获喜欢 1306 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

史上最全整合第三方登录的开源库

happlyfox

OAuth 2.0 28天写作 3月日更

神经网络攻防: 02.攻击模型的输出层

P小二

AIPwn AI安全 P小二 神经网络攻防

【LeetCode】俄罗斯套娃信封问题Java题解

Albert

算法 LeetCode 28天写作

用 Go 写一个轻量级的 ssh 批量操作工具

冯骐

运维 SSH Go 语言

Golang 中的并发限制与超时控制

冯骐

并发 超时 Go 语言

用 Nginx 的 auth_request 模块集成 LDAP 认证

冯骐

Python nginx 运维 ldap 认证

软件开发,如何快速有效缩短项目周期

雯雯写代码

软件开发

LeetCode题解:190. 颠倒二进制位,移动n,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

《精通比特币》学习笔记(第一章)

棉花糖

区块链 读书笔记

迄今为止最好用的Flink SQL教程:Flink SQL Cookbook on Zeppelin

Apache Flink

flink

阿里P7亲自讲解!如何快速的开发一个完整的直播app,成功入职腾讯

欢喜学安卓

android 程序员 面试 移动开发

神经网络攻防:03.使用API修改神经网络参数

P小二

AIPwn AI安全 P小二 神经网络攻防

思科设备漏洞 CVE-2018-0171 的快速修复

冯骐

Python 运维 安全 网络 交换机

Pgbouncer最佳实践:系列四

PostgreSQLChina

数据库 postgresql 软件 开源社区

Serverless 极致弹性解构在线游戏行业痛点

阿里巴巴云原生

Serverless 微服务 开发者 云原生 消息中间件

区块链产业革命:解决融资租赁之谜

旺链科技

区块链应用 融资租赁

【经验分享】如何释放企业CMDB价值?——CMDB建设路径浅谈

嘉为蓝鲸

运维自动化 配置中心 CMDB 配置信息 配置管理

用 Go 写一个轻量级的 ldap 测试工具

冯骐

运维 开发 ldap Go 语言

拍乐云加盟UCloud优云精选计划,构建云上的美好互动

拍乐云Pano

ucloud 云服务 RTC 拍乐云 白板

交换机配置的自动备份与变更告警

冯骐

Python 运维 网络 备份 multissh

Nginx安装后要做的第一件事

运维研习社

nginx WEB安全

在主动要求涨工资这事上,不要学我!从第一份工资800开始说起

四猿外

程序员 涨薪 工资 收入 跳槽

阿里P7亲自讲解!驱动核心源码详解和Binder超系统学习资源,跳槽薪资翻倍

欢喜学安卓

android 程序员 面试 移动开发

都 2021 年了,也该抛弃 ExpressJS 了

LeanCloud

大前端 nodejs 框架

2021总结全网最新、最全、最实用Java岗面试真题!已收录GitHub

比伯

Java 编程 架构 面试 程序人生

GitHub上获赞10万star的高并发神级进阶资料,面试官再问高并发问题请你把这篇文章发给他!

Java架构之路

Java 程序员 架构 面试 编程语言

四面阿里成功斩获offer,在此分享我的复盘经验总结!

Java架构之路

Java 程序员 架构 面试 编程语言

Open-Falcon 中的 LDAP 认证

冯骐

Python 运维 Open-Falcon ldap Go 语言

面试官:如何用SpringCloud从零设计一个大型电商平台?

Java架构追梦

Java 架构 面试 微服务 SpringCloud

云安全和访问管理

龙归科技

云计算 安全 云端 企业安全

手把手教学,如何使用低代码快速构建应用程序步骤详解!

优秀

低代码

专访腾讯小知陈松坚:知识表示是NLP乃至AI发展的瓶颈_AI&大模型_陈思_InfoQ精选文章