写点什么

腾讯云智能专场重磅发布:云小微数智人集体亮相,语音智能品牌全新升级

  • 2021-11-04
  • 本文字数:1433 字

    阅读完需:约 5 分钟

腾讯云智能专场重磅发布:云小微数智人集体亮相,语音智能品牌全新升级

11 月 4 日,在2021腾讯数字生态大会云智能专场上,腾讯云小微发布基于新一代多模态人机交互技术的全新数智人产品矩阵,共包括 5 款全新数智人产品,拥有文旅导览、金融客服、多语种主播、手语主播等不同职业身份和技能,可提供定制化角色服务。此外,腾讯云小微与腾讯 AI Lab 联合发布了全新技术品牌——腾讯语音智能,为设备提供在复杂语音环境下,从输入到输出交互体验全面升级的全链路的 AI+声学技术解决方案。

腾讯云小微 5 款数智人亮相


值得一提的是,在本届腾讯数字生态大会多个专场上,数智人也承担起了主持工作。“数智人正在走进我们的生活,在企业中承担岗位职责,为用户创造前所未有交互智能体验同时,提升企业服务效率和品牌形象。”腾讯智能产品副总裁、腾讯教育副总裁李学朝表示,腾讯云小微新一代数智人整合了语音交互、自然语言理解、图像识别等 AI 能力,融合AI Lab前沿 AI 技术以及搜狗数字人团队丰富的业务模式,目前已经在金融、传媒、文旅、出行等多各业务场景领域发挥价值。


腾讯智能产品副总裁、腾讯教育副总裁 李学朝


据了解,腾讯云小微数智人是腾讯云智能战略的重要组成部分。


技术方面,通过 NLP、知识图谱、视觉等全栈 AI 底层能力,让数智人拥有形象表现力、识别力和感知理解能力,可识别超 34 种语种、方言,拥有超过 46 万垂直行业场景热词库,在多业务场景中都能做到“听得清、听得懂、会表达”。其次,3D 超写实、3D 写实、3D 半写实、2D 真人、2D 卡通五种数智人的风格可满足各类场景服务需求,拥有超细微面部情感表情以及数百种肢体动作,在形象选择方面,不但可支持定制化需求,还获得了腾讯海量 IP 形象授权,助力品牌与用户心智产生更紧密的连接。


五款数智人亮相


应用方面,数智人已经在金融、文旅、传媒、教育等行业领域提供交互服务。例如,在文旅领域,数智人化身导游,在故宫、龙门石窟等景区提供 AI 导览服务,为游客提供个性化游览路线推荐,景点文物讲解等多种服务。


未来,数智人技术将重点向融合文字、听觉、视觉、触觉、肢体动作等多维度感知的多模态交互方式演进。

腾讯发布语音智能全新品牌


会上,腾讯云小微与腾讯 AI Lab 联合发布了全新技术品牌——腾讯语音智能。


据介绍,相对于传统解决方案,腾讯语音智能在技术上实现了一系列升级:通过采用一体化的基于全神经网络的方案,极大提升了在复杂场景下语音采集、降噪分离和增强的效果,从而为人人通话或机器识别提供了更清晰易懂的语音;通过使用基于语音语义联合优化的多领域识别器,让机器对于各种复杂语音的识别率也得到极大提升,可以更好地进行转写、理解、和回复。


在前端技术上,腾讯语音智能通过研发全神经网络波束成型方案、构建集合全链路的神经网络模型方案、首创用三种模态进行语音分离的工作模式,可有效应对环境噪声干扰人声的问题,实现了场景深度定制,多模块自动联合优化,在复杂声学环境中大幅度降低了语音收集的错误率。数据表示,经过多模态语音分离再进行语音识别,错误率可降低相对 50%,经过多模态分离并联合进行多模态的语音识别,错误率可进一步降低相对 25%。


在后端处理环节,腾讯语音智能研发了“语音-语义结合的多领域在线识别系统”、“全双工交互及闲聊拒识”、“端到端高性能离线识别系统”等技术方案,运用深度学习建模、前后端联合优化、语音-语义联合优化等技术手段,很好地满足了不同应用场景下,对于语音交互在识别率、鲁棒性、资源消耗和用户体验等多方面的要求。


未来,随着行业和场景需求的迭代升级和智能终端的快速发展,智能语音的应用将拥有越来越大的发展空间。腾讯语音智能也将持续专注语音智能技术,发展连续对话、多模态交互等能力。

2021-11-04 19:123491

评论

发布
暂无评论
发现更多内容

通过一流的NFT开发提升您的数字形象

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 链游开发 NFT开发

国际顶会SC23收录唯一区块链论文,微众银行技术实力受学术界认可

新消费日报

亚信科技AntDB数据库携“U8C+AntDB联合产品”亮相“2023全球商业创新大会”,开启生态合作新篇章

亚信AntDB数据库

数据库 AntDB AntDB数据库

数据库顶会 VLDB 2023 论文解读:字节跳动如何解决超大规模流式任务运维难题

字节跳动云原生计算

flink 流式计算 VLDB

three.js 纹理

3D建模设计

three.js 纹理处理

企业大数据传输的四类方式及镭速解决方案

镭速

大数据传输

木鱼一敲烦恼丢掉,一个恢复内心平静的赛博空间

荣耀开发者服务平台

小程序 前端 安卓 组件 服务卡片

中东、新加坡资本来华“淘宝”,AI、新能源成追逐赛道

TE智库

新能源 能源经济

小灯塔系列-中小企业数字化转型系列研究——司库管理测评报告

向量智库

大数据平台数据安全保护系统哪家好?咨询电话多少?

行云管家

大数据 数据安全 大数据平台 大数据安全

软件测试/测试开发丨跨平台 api 对接 学习笔记

测试人

Python 软件测试 jenkins API 测试开发

选择正确的框架:探索 Spring Cloud 和 Dubbo

Liam

程序员 微服务 Spring Cloud dubbo 后端

你折腾一天都装不上的插件,函数计算部署 Stable Diffusion 都内置了

Serverless Devs

Serverless 模型

人工智能的优势:使用 GPT 和扩散模型生成图像

3D建模设计

人工智能 生成式AI

OpenAI 函数调用教程

3D建模设计

openai ChatGPT

Linux 可执行文件瘦身指令 strip 使用示例

互联网工科生

Linux 资源

使用 WebGL 为 HTML5 游戏创建逼真的地形

3D建模设计

WebGL 地形

安全大文件传输对行业重要性

镭速

大文件传输 传输大文件 安全大文件传输

Python 套接字编程完整指南

3D建模设计

Python

即时通讯技术文集(第19期):IM架构设计基础知识合集 [共13篇]

JackJiang

网络编程 即时通讯 IM

必备利器:可靠的 REST API 开发工具

Apifox

程序员 开发工具 Apifox API REST API

828 B2B企业节:ROMA Connect探究数字化转型之道

华为云PaaS服务小智

云计算 软件开发 华为云

腾讯云智能专场重磅发布:云小微数智人集体亮相,语音智能品牌全新升级_产品_凌敏_InfoQ精选文章