写点什么

百度 UNIT3.0 及语音技术平台迎来重磅升级,技术细节独家解读

  • 2019-05-20
  • 本文字数:2298 字

    阅读完需:约 8 分钟

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读

2017 年 7 月,百度在 AI 开发者大会上发布对话系统定制平台 UNIT,它搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力。


2018 年 7 月,UNIT 推出的 2.0 版本,技术、功能与架构实现全面升级,为开发者提供更加易用、更加专业的对话系统定制能力。


2019 年 5 月 15 日,"与未来对话——百度大脑智能对话引擎及产品发布会"正式举行,会上首次曝光百度大脑智能对话生态,并推出全新的智能对话引擎。


基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的 AI 技术,百度已形成包含 UNIT 3.0 和语音技术平台的百度大脑智能对话引擎,并在此基础上推出客服、消费电子和出行三大智能对话场景方案。会上,百度自然语言处理部主任架构师孙珂博士宣布百度大脑对话系统定制平台 UNIT3.0 全新升级,并发布 9 大核心特性,为国内智能对话领域打造了技术最强、能力最丰富、使用规模最大的智能对话定制平台。



孙珂介绍,UNIT 平台已累计超 460 亿次的交互量。而在应用中,从对话核心技术到一个场景化的真实对话系统落地,企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此,百度大脑推出 UNIT3.0 版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级。



技能搭建包括预置技能和自定义技能。此次全新发布了智能问答、设备控制、影音休闲、生活服务等多个方面共 58 项积累自真实业务的预置技能;同时,预置技能也支持开发者结合特定场景进行再次开发,使其更符合场景业务需要。自定义问答技能方面,全新发布了文档问答功能,支持开发者上传业务文档并一键训练,在 1 分钟内快速定制问答系统。自定义对话技能方面,正式发布训练数据生产与标注辅助工具 DataKit,实现自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。此外, “深度训练”模型全新升级融入百度最新发布的语义表示预训练模型 ERNIE,可在标注数据大量减少的情况下达到同样效果。升级后的 DataKit 和基于深度训练的理解技术可谓是“强强联合”,可使对话技能的综合研发成本节省 60%。


据了解,70%的企业在智能对话系统构建过程中,都面临梳理和准备企业知识的困难环节,针对这一痛点,UNIT3.0 在构建知识方面实现重磅升级。全新发布问答知识库构建工具,帮助开发者构建问答知识库,节省人工成本。新发布的图谱知识库构建工具可以辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识也可以导入 UNIT 问答技能词槽词典,进一步帮助对话理解效果的优化。


UNIT3.0 也进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。技能管理实现多技能顺序可调,并共享全局记忆;对话管理具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,HTTP 服务全面支持接入。


听懂语音、理解对话、快速反馈是智能对话中的重要组成部分,对此语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。在呼叫中心场景中,提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型、呼叫中心场景专属的语音合成音库,满足适配主流厂家 MRCP 对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。


除了端到端的呼叫中心语音技术方案,全新发布的语音自训练平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。


深入落地场景,是智能对话发展的必然趋势,也是普及化的必经过程。基于在智能对话领域多年的经验、技术积累,百度大脑推出了典型的、有针对性的三大对话场景方案,分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。这三大方案都从领域业务需求、集成与配合、部署与维护做出了不同程度的升级。



客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点,推出全新的语音语义一体化中控,实现一次交互完成语音和对话理解服务访问同时,预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。此外,在部署与维护方面实现了云端部署和私有化部署的多样化部署,可按需匹配。


消费电子对话场景方案综合考虑其场景、资源的开放性,软硬件终端产品的多元化等特点,除了前面提到的沉淀至真实场景的 58 项预置技能和优质的信息与问答资源外,还开源了对话管理模块 DMKit、对话中控模块 USKit,它们具备与云端理解能力无缝对接,帮助开发者深度定制对话技能。也支持公有云、虚拟私有域部署模式,提供完善的 Android、iOS SDK 接入方式,还可一键接入 DuerOS 和小程序等。


出行智能对话场景方案是面向出行场景专属定制的,拥有车载专属语音解决方案和车厂专属语义定制平台。车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。车厂专属语义定制平台提供丰富的预置能力和车厂技能自定制能力支持。此外,面向车载网络稳定性不可控特性,我们推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能,高性能离线语义嵌入式 SDK;也推出了支持出行场景离在线对话能力融合的框架。


活动的最后,百度 AI 技术生态部总经理喻友平发布了智能对话引擎生态计划,推出了百度大脑智能对话深度训练营以及百度大脑智能对话引擎白皮书,提供从智能对话技术纲领到应用实践的全面指导。未来,百度大脑将持续发力智能对话领域,让语言推动机器进步。


2019-05-20 12:296017
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 278.6 次阅读, 收获喜欢 1301 次。

关注

评论

发布
暂无评论
发现更多内容

趁着课余时间学点python(二)缩进 标识符 保留字 注释 输入输出的理解

ベ布小禅

8月日更

奥运“哮喘”运动员为什么越来越多?

脑极体

【最不佳实践】文件上传并不简单

刘宇

Python Serverless 文件上传

为什么需要数据库连接池

赖猫

MySQL 数据库 后端 连接池

黄金圈法则解读数据中台(1):为什么需要数据中台

水滴

数据中台 黄金圈法则 8月日更

DDD领域驱动设计·学习应用·一

小诚信驿站

领域驱动设计 领域驱动模型DDD 中台架构 领域驱动

NLP随笔(三)

毛显新

人工智能 自然语言处理 神经网络 深度学习

王者并发课-钻石2:分而治之-如何从原理深入理解ForkJoinPool的快与慢

MetaThoughts

Java 多线程 并发

JDK 从8升级到11,使用 G1 GC,HBase 性能下降近20%。JDK 到底干了什么?

毕昇JDK社区

在线网页快捷方式创建工具

入门小站

工具

Hbase 入门详解

Se7en

再见 Jenkins!几行脚本搞定自动化部署,这款神器有点厉害

编程菌

Java 编程 程序员 计算机 技术宅

第一次凡尔赛,字节跳动3面+腾讯6面一次过,谈谈我的大厂面经

编程菌

Java 编程 程序员 面试 计算机

2020-2021华为Java面试真题

Geek_f90455

Java 程序员 后端

2020-2021阿里巴巴Java面试真题解析

Geek_f90455

Java 程序员 后端

【最不佳实践】函数计算的函数是什么意思

刘宇

Serverless

Windows10下JDK8下载及java环境配置

Bob

8月日更

我测了啊,我真测了!

QualityFocus

测试 质量保障 线上问题 缺陷

弱口令到底是什么牛马?

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

一个好的产品需要一个好的产品

刘宇

产品经理

Elasticsearch VS ClickHouse

Se7en

SpringBoot 中的事务处理

xcbeyond

事务 springboot 8月日更

缓存数据历险记(一)--被缓存警察上课一天

卢卡多多

redis 缓存 8月日更

Vue组件通信之ref

Augus

8月日更

「SQL数据分析系列」15. 元数据

Databri_AI

sql 脚本 元数据

各种消息队列设计要点与对比

海明菌

消息队列 消息队列对比 消息队列系统设计

网络攻防学习笔记 Day94

穿过生命散发芬芳

网络攻防 8月日更

Linux之watch命令

入门小站

Linux

12年高级工程师的“飞升之路”

Geek_f90455

Java 程序员 后端

2020-2021京东Java面试真题解析

Geek_f90455

Java 程序员 后端

从未如此简单:基于Serverless架构的博客

刘宇

Serverless Hexo 博客

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读_AI&大模型_陈思_InfoQ精选文章