10月26号,了解如何7天上架一个语聊房应用 了解详情
写点什么

云视频会议“黑科技”,开放才是“硬”道理

2021 年 7 月 20 日

云视频会议“黑科技”,开放才是“硬”道理

疫情之下,“云办公”需求呈爆发式增长,推动RTC(实时音视频)行业迅速发展。进入后疫情时代,在线会议成为企业高效办公的标配。数据显示,协作时间占员工工作时间的 50%-80%。针对项目讨论或与客户进行沟通的小型协作空间数量未来将大幅增长。越来越多的企业衍生出线上线下协同开会的混合式会议需求,随之而来的问题是如何有效应对企业会议室复杂场景的开会难题。


多样性场景,在线会议挑战重重

 

传统在线会议产品更侧重于在企业内部沟通使用,形态上以专用设备和 PC 端居多。而当前的在线会议不再局限于内部,跨企业沟通需求呈爆发式增长。在线会议的接入场景也延伸到传统办公场景之外,用户希望不管从 Windows、IOS、安卓端甚至是电话的形式都可以轻轻松松接入在线的一个会议。

 

除终端以外,会议室本身也涵盖多种复杂的会议场景。如针对中小型会议室,要求聚焦于能完成相互之间沉浸式的互动讨论;针对大型会议室用户则希望能实现和远端清晰、无障碍的沟通,此外还有超大型会议室、培训室甚至开放办公空间等拥有不同需求的场景。

 

另外,不同行业的在线会议也存在不同的需求。比如,教育行业的双师教学场景下,在线会议要求做到多端接入,实现沉浸式的协作讲学;医疗行业的远程问诊场景下,则需要保证优质的传输质量,实现医生和病人的实时互动。如何满足不同行业场景下的多样化需求,也是在线会议面临的一大挑战。

 

硬件厂商困境,音频采集解决方案参差不齐

 

对于在线会议来说,提供高品质音视频是其核心能力。就目前而言,国内大屏厂商的音频采集解决方案音质参差不齐,距离国外一流的会议音频设备商音质有明显差距。

 

市面上很多硬件的实际拾音距离仅为 2 到 4 米左右。在远场情景下,讲话者会因离麦克风距离远,导致麦克风采集到的有效信号逐渐减弱,信噪比降低。因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。

 

除远距离拾音,会议室噪声问题也是很多硬件厂商无法解决的。设备热噪声、键盘噪声、空调噪声以及其他会议现场突发噪声几乎是不可避免的。

 

此外,当会议室场地空旷,声音经过玻璃和墙面的折射后产生反射声和混响,各类噪声也会严重影响到开会质量。在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。

 

技术突破,腾讯会议发布天籁语音模组方案

 

自 QQ 时代实现语音通话,腾讯在音视频领域已有超过 20 年的积累。持续不断的数据积累下,腾讯云将基于深度学习的技术模型和训练方法运用到端到端的音视频通信里面,对每个环节的具体技术进行升级改造,不断优化用户体验。基于此,2019 年 12 月 25 日,腾讯云发布云视频会议产品——腾讯会议。产品发布 1 个月左右,“宅家办公”令企业和个人对远程会议的需求爆发式增长。面对突如其来的巨大挑战,腾讯会议扛住压力,对产品进行迅速优化、迭代,上线仅 2 个月,日活用户超过 1000 万。

 

疫情趋于稳定后,腾讯会议将重心逐渐调整为功能和服务质量的提升。在音视频性能层面,腾讯会议利用 AI 算法和大数据分析能力,对音视频通话质量进行了全面提升。为了应对会议室场景各种复杂声学场景下的实时语音通信技术,腾讯会议旗下天籁实验室现针对大中型会议室的 All-In-One 大屏产品面临的远场双工通信的挑战,融合经典信号处理和端到端深度学习模型,发布天籁语音模组方案。

 

天籁语音模组基于软硬一体的声学硬件设计,通过麦克风阵列和多模态深度学习技术相融合,首次结合房间声场感知,采集和空间声场重建技术,开创性地解决会议室复杂场景下的实时音视频技术难题。其中,远距离拾音可达 12 米、突破性地将设备上行时延降低至几十毫秒、可消除键盘声、脚步声、开关门声等超过 200 种会议室常见噪音,并能实现双讲无剪切,无回声泄露,无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真,提升会议参与感。


开放技术能力,打造云视频会议生态

 

作为视频会议软件系统,腾讯会议可以和不同形态的硬件进行结合。为提升云视频会议体验,解决硬件厂商面临的问题,腾讯会议开放技术能力,积极与硬件厂商进行合作。

 

通过开放标准 API 接口以及二次开发,助力企业 IT、系统集成商等合作伙伴轻松适配多种会议场景,快速实现与腾讯会议的连接。企业可以根据预算、使用习惯、会议室规模,灵活购买官方认证的硬件终端来配置会议室,覆盖从独立行政办公室到大型培训教室的会议需求。数据显示,近万家企业通过接入腾讯会议 API,大幅提升不同场景的会议体验。

 

不仅开放 API,在硬件方面,腾讯会议也开放了很好的生态。为使音视频方面的核心能力得到充分发挥,腾讯会议开放音视频认证标准,通过天籁实验室对 All-in-one 触摸式一体机、音视频外设组合等设备进行专业化认证、优化。

 

腾讯天籁实验室总经理商世东表示:“当前,在线会议使用体验和面对面的沟通交流区别还是很大,在线会议还有很长的路要走,未来,我们相信 RTC 行业会达到这样的水平——让在线体验和现实体验尽可能接近”

2021 年 7 月 20 日 23:582466

评论

发布
暂无评论
发现更多内容

传统巨头抢占区块链场景高地 医疗、汽车、金融成为热门赛道

CECBC区块链专委会

区块链 金融

Elasticsearch 新机型发布,性能提升30%

腾讯云大数据

大数据 elasticsearch Elastic Stack

AWS 助力贝壳VR看房走出国门,升级全球居住服务新体验

亚马逊云科技 (Amazon Web Services)

AWS

Apache顶级项目ShardingSphere — SQL Parser的设计与实现

京东数科风险算法与技术

数据库 开源 中间件

这才是你需要的C/C++Linux学习路线!

赖猫

c++ Linux 后台开发 服务器开发

附PPT丨AI和云原生时代的数据库进化之路

dbaplus社群

数据库 云原生

架构师训练营 Week9 - 课后作业

极客大学架构师训练营

生产环境全链路压测建设历程之十一:生产压测给淘宝网带来的价值

数列科技杨德华

全链路压测

Shell脚本命令常用技巧

MySQL从删库到跑路

shell脚本编写

大咖直播 | Elasticsearch 应用监控管理平台搭建实战

腾讯云大数据

大数据 elasticsearch Elastic Stack 监控管理平台

JAVA基础 -- java8新特性一之 lambda表达式

起个名字很难

java基础

Python进阶——为什么GIL让多线程变得如此鸡肋?

Kaito

Python

告别消费主义的双12,是华为云12.12会员节真正的意义

脑极体

牵头成立“现代计算联盟”,强大如谷歌也需要组团打怪吗?

脑极体

浅谈JDK并发包下面的分治思想及分治思想在高并发场景的运用

AI乔治

Java 架构 jdk 分布式 多线程与高并发

图文回顾丨北京「解构云原生:企业数字化转型新支点」沙龙

RancherLabs

k8s rancher

云原生架构-可观测性之 Prometheus 服务自动发现

云原生实验室

静态代码分析工具评估指标及方法

maijun

建信金科大咖访谈:金融衍生品定价与建行实践

金科优源汇

金融科技 金融创新

几种常见的研发管理体系,哪种更适合你?

菜根老谭

敏捷开发 研发管理 CMMI IPD

JAVA基础 -- java8新特性一之 方法引用

起个名字很难

java基础

如何构建彼此信任相托的团队?

Alan

团队管理 个人成长 团队协作

信任的传递——为什么我们需要第三方授权?

Thoughtworks洞见

证书 身份认证

记一次MapReduce的内存溢出

AI乔治

Java mapreduce 架构 内存溢出

互联网应用系统常见问题与方案

raox

极客大学架构师训练营

Java并发编程:如何防止在线程阻塞与唤醒时死锁

码农架构

Java 并发编程

架构一期第十二周作业

Airs

EMAS远程日志 - 移动端问题排查利器

应用研发平台EMAS

阿里云 运维 日志 监控告警 应用

自建本地电话告警系统

周楠

运维 物联网 监控告警

JAVA基础 -- java8新特性一之 Stream流以及基本操作

起个名字很难

架构之书:田园与《Agile Web Development with Rails》

lidaobing

ruby-on-rails 架构

云视频会议“黑科技”,开放才是“硬”道理-InfoQ