【QCon】精华内容上线92%,全面覆盖“人工智能+”的典型案例!>>> 了解详情
写点什么

腾讯云智能专场重磅发布:云小微数智人集体亮相,语音智能品牌全新升级

  • 2021-11-04
  • 本文字数:1433 字

    阅读完需:约 5 分钟

腾讯云智能专场重磅发布:云小微数智人集体亮相,语音智能品牌全新升级

11 月 4 日,在2021腾讯数字生态大会云智能专场上,腾讯云小微发布基于新一代多模态人机交互技术的全新数智人产品矩阵,共包括 5 款全新数智人产品,拥有文旅导览、金融客服、多语种主播、手语主播等不同职业身份和技能,可提供定制化角色服务。此外,腾讯云小微与腾讯 AI Lab 联合发布了全新技术品牌——腾讯语音智能,为设备提供在复杂语音环境下,从输入到输出交互体验全面升级的全链路的 AI+声学技术解决方案。

腾讯云小微 5 款数智人亮相


值得一提的是,在本届腾讯数字生态大会多个专场上,数智人也承担起了主持工作。“数智人正在走进我们的生活,在企业中承担岗位职责,为用户创造前所未有交互智能体验同时,提升企业服务效率和品牌形象。”腾讯智能产品副总裁、腾讯教育副总裁李学朝表示,腾讯云小微新一代数智人整合了语音交互、自然语言理解、图像识别等 AI 能力,融合AI Lab前沿 AI 技术以及搜狗数字人团队丰富的业务模式,目前已经在金融、传媒、文旅、出行等多各业务场景领域发挥价值。


腾讯智能产品副总裁、腾讯教育副总裁 李学朝


据了解,腾讯云小微数智人是腾讯云智能战略的重要组成部分。


技术方面,通过 NLP、知识图谱、视觉等全栈 AI 底层能力,让数智人拥有形象表现力、识别力和感知理解能力,可识别超 34 种语种、方言,拥有超过 46 万垂直行业场景热词库,在多业务场景中都能做到“听得清、听得懂、会表达”。其次,3D 超写实、3D 写实、3D 半写实、2D 真人、2D 卡通五种数智人的风格可满足各类场景服务需求,拥有超细微面部情感表情以及数百种肢体动作,在形象选择方面,不但可支持定制化需求,还获得了腾讯海量 IP 形象授权,助力品牌与用户心智产生更紧密的连接。


五款数智人亮相


应用方面,数智人已经在金融、文旅、传媒、教育等行业领域提供交互服务。例如,在文旅领域,数智人化身导游,在故宫、龙门石窟等景区提供 AI 导览服务,为游客提供个性化游览路线推荐,景点文物讲解等多种服务。


未来,数智人技术将重点向融合文字、听觉、视觉、触觉、肢体动作等多维度感知的多模态交互方式演进。

腾讯发布语音智能全新品牌


会上,腾讯云小微与腾讯 AI Lab 联合发布了全新技术品牌——腾讯语音智能。


据介绍,相对于传统解决方案,腾讯语音智能在技术上实现了一系列升级:通过采用一体化的基于全神经网络的方案,极大提升了在复杂场景下语音采集、降噪分离和增强的效果,从而为人人通话或机器识别提供了更清晰易懂的语音;通过使用基于语音语义联合优化的多领域识别器,让机器对于各种复杂语音的识别率也得到极大提升,可以更好地进行转写、理解、和回复。


在前端技术上,腾讯语音智能通过研发全神经网络波束成型方案、构建集合全链路的神经网络模型方案、首创用三种模态进行语音分离的工作模式,可有效应对环境噪声干扰人声的问题,实现了场景深度定制,多模块自动联合优化,在复杂声学环境中大幅度降低了语音收集的错误率。数据表示,经过多模态语音分离再进行语音识别,错误率可降低相对 50%,经过多模态分离并联合进行多模态的语音识别,错误率可进一步降低相对 25%。


在后端处理环节,腾讯语音智能研发了“语音-语义结合的多领域在线识别系统”、“全双工交互及闲聊拒识”、“端到端高性能离线识别系统”等技术方案,运用深度学习建模、前后端联合优化、语音-语义联合优化等技术手段,很好地满足了不同应用场景下,对于语音交互在识别率、鲁棒性、资源消耗和用户体验等多方面的要求。


未来,随着行业和场景需求的迭代升级和智能终端的快速发展,智能语音的应用将拥有越来越大的发展空间。腾讯语音智能也将持续专注语音智能技术,发展连续对话、多模态交互等能力。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2021-11-04 19:122621

评论

发布
暂无评论
发现更多内容

Redis的适用场景简单剖析

大数据技术指南

redis 4月日更

0门槛成为“技术牛人”!星环科技线上分享课“星课堂”开播,快来报名,一探究竟

星环科技

人工智能 数据库 云计算 大数据 直播技术

Golang 对象池

escray

学习 极客时间 Go 语言 4月日更

GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理

不脱发的程序猿

人工智能 GitHub 开源 OCR 4月日更

一入爬虫深似海,从此早睡是路人

Thrash

【转载】图形化系统开发组件X-Series(一)——XrossUnit介绍

赫杰辉

华云大咖说 | 华云数据与数科网维携手共建国产云生态

华云数据

三步法助你快速定位网站性能问题

华为云开发者联盟

html 网站 网站优化 Performance面板 瀑布图

阿里巴巴的“双11”高并发秒杀终极版教程!(Java语言设计)

Java架构追梦

Java 阿里巴巴 架构 面试 秒杀架构设计

轻松带你学习java-agent

华为云开发者联盟

Java Trace Java虚拟机 java-agent 挂载

前端DDD总结与思考

白玉兰开源

大前端 DDD

从源码分析 MySQL 死锁问题入门

比伯

Java 编程 程序员 架构 计算机

重磅来袭:Spring之RequestBody的使用姿势小结

学Java关注我

Java 编程 架构 技术 程序人生

事件分发机制Android,熬夜整理Android面试笔试题,精心整理

欢喜学安卓

android 程序员 面试 移动开发

手把手教你从数据预处理开始体验图数据库

NebulaGraph

数据库 数据预处理

4行指令解决pip下载Python第三方库太慢问题(pip更换国内下载源)

不脱发的程序猿

Python pip 4月日更 Python库安装

云管平台如何纳管多云资源?

嘉为蓝鲸

云计算 运维自动化 cmp 混合云 多云管理平台

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

Apache Flink

flink

事件分发源码,Android事件分发机制收藏这一篇就够了,威力加强版

欢喜学安卓

android 程序员 面试 移动开发

分布式锁之Redis实现

Sakura

4月日更

https如何使用python+flask来实现

华为云开发者联盟

Python flask https ssl HTTP协议

前端规范之路

白玉兰开源

大前端 开发规范

2020年12月的面试经历:美团4面+字节4面(均已拿offer),面试真题分享

Java架构师迁哥

实践案例丨Pt-osc工具连接rds for mysql 数据库失败

华为云开发者联盟

MySQL 数据库 pt-osc工具 rds for mysql

5个超好用的Instagram图片下载工具推荐

科技猫

分享 下载 教程 图片 Instagram

前端⼤规模构建演进实践

白玉兰开源

架构 大前端

知识分享:SQL注入的流程和步骤

Thrash

sql

Kubernetes入门——Kubernetes应用部署

百度开发者中心

Kubernetes #技术课程#

什么是Selenium?使用Selenium进行自动化测试

码语者

DevOps selenium

智汇华云 | ArSDN打通软件定义数据中心的“任督二脉”

华云数据

【转载】提高系统开发效率的“银弹”——X-series可视化大规模应用开发工具集

赫杰辉

腾讯云智能专场重磅发布:云小微数智人集体亮相,语音智能品牌全新升级_产品_凌敏_InfoQ精选文章