写点什么

百度 UNIT3.0 及语音技术平台迎来重磅升级,技术细节独家解读

  • 2019-05-20
  • 本文字数:2298 字

    阅读完需:约 8 分钟

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读

2017 年 7 月,百度在 AI 开发者大会上发布对话系统定制平台 UNIT,它搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力。


2018 年 7 月,UNIT 推出的 2.0 版本,技术、功能与架构实现全面升级,为开发者提供更加易用、更加专业的对话系统定制能力。


2019 年 5 月 15 日,"与未来对话——百度大脑智能对话引擎及产品发布会"正式举行,会上首次曝光百度大脑智能对话生态,并推出全新的智能对话引擎。


基于百度多年积累的自然语言处理、知识图谱和语音等对话相关的 AI 技术,百度已形成包含 UNIT 3.0 和语音技术平台的百度大脑智能对话引擎,并在此基础上推出客服、消费电子和出行三大智能对话场景方案。会上,百度自然语言处理部主任架构师孙珂博士宣布百度大脑对话系统定制平台 UNIT3.0 全新升级,并发布 9 大核心特性,为国内智能对话领域打造了技术最强、能力最丰富、使用规模最大的智能对话定制平台。



孙珂介绍,UNIT 平台已累计超 460 亿次的交互量。而在应用中,从对话核心技术到一个场景化的真实对话系统落地,企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此,百度大脑推出 UNIT3.0 版本,在搭建技能、构建知识和整合技能与知识三方面实现全面升级。



技能搭建包括预置技能和自定义技能。此次全新发布了智能问答、设备控制、影音休闲、生活服务等多个方面共 58 项积累自真实业务的预置技能;同时,预置技能也支持开发者结合特定场景进行再次开发,使其更符合场景业务需要。自定义问答技能方面,全新发布了文档问答功能,支持开发者上传业务文档并一键训练,在 1 分钟内快速定制问答系统。自定义对话技能方面,正式发布训练数据生产与标注辅助工具 DataKit,实现自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。此外, “深度训练”模型全新升级融入百度最新发布的语义表示预训练模型 ERNIE,可在标注数据大量减少的情况下达到同样效果。升级后的 DataKit 和基于深度训练的理解技术可谓是“强强联合”,可使对话技能的综合研发成本节省 60%。


据了解,70%的企业在智能对话系统构建过程中,都面临梳理和准备企业知识的困难环节,针对这一痛点,UNIT3.0 在构建知识方面实现重磅升级。全新发布问答知识库构建工具,帮助开发者构建问答知识库,节省人工成本。新发布的图谱知识库构建工具可以辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识也可以导入 UNIT 问答技能词槽词典,进一步帮助对话理解效果的优化。


UNIT3.0 也进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。技能管理实现多技能顺序可调,并共享全局记忆;对话管理具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,HTTP 服务全面支持接入。


听懂语音、理解对话、快速反馈是智能对话中的重要组成部分,对此语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。在呼叫中心场景中,提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型、呼叫中心场景专属的语音合成音库,满足适配主流厂家 MRCP 对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。


除了端到端的呼叫中心语音技术方案,全新发布的语音自训练平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。


深入落地场景,是智能对话发展的必然趋势,也是普及化的必经过程。基于在智能对话领域多年的经验、技术积累,百度大脑推出了典型的、有针对性的三大对话场景方案,分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。这三大方案都从领域业务需求、集成与配合、部署与维护做出了不同程度的升级。



客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点,推出全新的语音语义一体化中控,实现一次交互完成语音和对话理解服务访问同时,预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。此外,在部署与维护方面实现了云端部署和私有化部署的多样化部署,可按需匹配。


消费电子对话场景方案综合考虑其场景、资源的开放性,软硬件终端产品的多元化等特点,除了前面提到的沉淀至真实场景的 58 项预置技能和优质的信息与问答资源外,还开源了对话管理模块 DMKit、对话中控模块 USKit,它们具备与云端理解能力无缝对接,帮助开发者深度定制对话技能。也支持公有云、虚拟私有域部署模式,提供完善的 Android、iOS SDK 接入方式,还可一键接入 DuerOS 和小程序等。


出行智能对话场景方案是面向出行场景专属定制的,拥有车载专属语音解决方案和车厂专属语义定制平台。车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。车厂专属语义定制平台提供丰富的预置能力和车厂技能自定制能力支持。此外,面向车载网络稳定性不可控特性,我们推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能,高性能离线语义嵌入式 SDK;也推出了支持出行场景离在线对话能力融合的框架。


活动的最后,百度 AI 技术生态部总经理喻友平发布了智能对话引擎生态计划,推出了百度大脑智能对话深度训练营以及百度大脑智能对话引擎白皮书,提供从智能对话技术纲领到应用实践的全面指导。未来,百度大脑将持续发力智能对话领域,让语言推动机器进步。


2019-05-20 12:296471
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 298.5 次阅读, 收获喜欢 1306 次。

关注

评论

发布
暂无评论
发现更多内容

PD的时钟服务——TSO

TiDB 社区干货传送门

TiDB 中的全局唯一 ID

TiDB 社区干货传送门

【精选实践】网易互娱的数据库选型和 TiDB 应用实践

TiDB 社区干货传送门

【精选实践】TiDB 在丰巢核心支付平台百亿级数据的深度实践

TiDB 社区干货传送门

北京“TiDB 性能调优专场”活动小组讨论结论

TiDB 社区干货传送门

【精选实践】汽车之家从 SQL Server 到 TiDB 的异构变迁

TiDB 社区干货传送门

TiDB 在爱奇艺的业务场景及实践

TiDB 社区干货传送门

使 pt-kill 和 pt-query-digest 工具兼容 TiDB

TiDB 社区干货传送门

TiDB 4.0 试玩体验--Tiflash

TiDB 社区干货传送门

实践案例

TiDB备份实现

TiDB 社区干货传送门

管理与运维

Multi-Master 数据库概览

TiDB 社区干货传送门

TiKV笔记-Raft复制状态机--未完

TiDB 社区干货传送门

分布式系统 in 2010s

TiDB 社区干货传送门

实践案例

使用Zabbix监控TiDB(二)

TiDB 社区干货传送门

监控

网易游戏 Flink on TiDB 实时数据业务实践

TiDB 社区干货传送门

实践案例

体验更简单的 DM —— v1.0.2

TiDB 社区干货传送门

TiDB-v4.0.x支持OLAP场景的一些实践经验

TiDB 社区干货传送门

性能调优

TiDB 联合索引是如何工作的

TiDB 社区干货传送门

TiDB慢日志解析源码解读

TiDB 社区干货传送门

DM在Docker环境部署安装

TiDB 社区干货传送门

TiKV架构原理(笔记)

TiDB 社区干货传送门

浅谈 TiDB 初始化系统库过程

TiDB 社区干货传送门

性能调优 TiDB 底层架构

生态工具原理学习笔记(笔记)

TiDB 社区干货传送门

忘记root密码的解决办法具体实现步骤

TiDB 社区干货传送门

管理与运维 安装 & 部署

事务前沿研究丨事务并发控制

TiDB 社区干货传送门

TiDB 底层架构

TiKV 多副本丢失以及修复实践

TiDB 社区干货传送门

实践案例

再记一次业务优化

TiDB 社区干货传送门

Elastic Stack处理TiDB慢日志

TiDB 社区干货传送门

同步工具Gravity杂谈

TiDB 社区干货传送门

基于Drainer的TiDB的闪回实现

TiDB 社区干货传送门

TiDB使用场景漫谈

TiDB 社区干货传送门

实践案例

百度UNIT3.0及语音技术平台迎来重磅升级,技术细节独家解读_AI&大模型_陈思_InfoQ精选文章