【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

云视频会议“黑科技”,开放才是“硬”道理

  • 2021-07-20
  • 本文字数:2026 字

    阅读完需:约 7 分钟

云视频会议“黑科技”,开放才是“硬”道理

疫情之下,“云办公”需求呈爆发式增长,推动RTC(实时音视频)行业迅速发展。进入后疫情时代,在线会议成为企业高效办公的标配。数据显示,协作时间占员工工作时间的 50%-80%。针对项目讨论或与客户进行沟通的小型协作空间数量未来将大幅增长。越来越多的企业衍生出线上线下协同开会的混合式会议需求,随之而来的问题是如何有效应对企业会议室复杂场景的开会难题。


多样性场景,在线会议挑战重重

 

传统在线会议产品更侧重于在企业内部沟通使用,形态上以专用设备和 PC 端居多。而当前的在线会议不再局限于内部,跨企业沟通需求呈爆发式增长。在线会议的接入场景也延伸到传统办公场景之外,用户希望不管从 Windows、IOS、安卓端甚至是电话的形式都可以轻轻松松接入在线的一个会议。

 

除终端以外,会议室本身也涵盖多种复杂的会议场景。如针对中小型会议室,要求聚焦于能完成相互之间沉浸式的互动讨论;针对大型会议室用户则希望能实现和远端清晰、无障碍的沟通,此外还有超大型会议室、培训室甚至开放办公空间等拥有不同需求的场景。

 

另外,不同行业的在线会议也存在不同的需求。比如,教育行业的双师教学场景下,在线会议要求做到多端接入,实现沉浸式的协作讲学;医疗行业的远程问诊场景下,则需要保证优质的传输质量,实现医生和病人的实时互动。如何满足不同行业场景下的多样化需求,也是在线会议面临的一大挑战。

 

硬件厂商困境,音频采集解决方案参差不齐

 

对于在线会议来说,提供高品质音视频是其核心能力。就目前而言,国内大屏厂商的音频采集解决方案音质参差不齐,距离国外一流的会议音频设备商音质有明显差距。

 

市面上很多硬件的实际拾音距离仅为 2 到 4 米左右。在远场情景下,讲话者会因离麦克风距离远,导致麦克风采集到的有效信号逐渐减弱,信噪比降低。因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。

 

除远距离拾音,会议室噪声问题也是很多硬件厂商无法解决的。设备热噪声、键盘噪声、空调噪声以及其他会议现场突发噪声几乎是不可避免的。

 

此外,当会议室场地空旷,声音经过玻璃和墙面的折射后产生反射声和混响,各类噪声也会严重影响到开会质量。在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。

 

技术突破,腾讯会议发布天籁语音模组方案

 

自 QQ 时代实现语音通话,腾讯在音视频领域已有超过 20 年的积累。持续不断的数据积累下,腾讯云将基于深度学习的技术模型和训练方法运用到端到端的音视频通信里面,对每个环节的具体技术进行升级改造,不断优化用户体验。基于此,2019 年 12 月 25 日,腾讯云发布云视频会议产品——腾讯会议。产品发布 1 个月左右,“宅家办公”令企业和个人对远程会议的需求爆发式增长。面对突如其来的巨大挑战,腾讯会议扛住压力,对产品进行迅速优化、迭代,上线仅 2 个月,日活用户超过 1000 万。

 

疫情趋于稳定后,腾讯会议将重心逐渐调整为功能和服务质量的提升。在音视频性能层面,腾讯会议利用 AI 算法和大数据分析能力,对音视频通话质量进行了全面提升。为了应对会议室场景各种复杂声学场景下的实时语音通信技术,腾讯会议旗下天籁实验室现针对大中型会议室的 All-In-One 大屏产品面临的远场双工通信的挑战,融合经典信号处理和端到端深度学习模型,发布天籁语音模组方案。

 

天籁语音模组基于软硬一体的声学硬件设计,通过麦克风阵列和多模态深度学习技术相融合,首次结合房间声场感知,采集和空间声场重建技术,开创性地解决会议室复杂场景下的实时音视频技术难题。其中,远距离拾音可达 12 米、突破性地将设备上行时延降低至几十毫秒、可消除键盘声、脚步声、开关门声等超过 200 种会议室常见噪音,并能实现双讲无剪切,无回声泄露,无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真,提升会议参与感。


开放技术能力,打造云视频会议生态

 

作为视频会议软件系统,腾讯会议可以和不同形态的硬件进行结合。为提升云视频会议体验,解决硬件厂商面临的问题,腾讯会议开放技术能力,积极与硬件厂商进行合作。

 

通过开放标准 API 接口以及二次开发,助力企业 IT、系统集成商等合作伙伴轻松适配多种会议场景,快速实现与腾讯会议的连接。企业可以根据预算、使用习惯、会议室规模,灵活购买官方认证的硬件终端来配置会议室,覆盖从独立行政办公室到大型培训教室的会议需求。数据显示,近万家企业通过接入腾讯会议 API,大幅提升不同场景的会议体验。

 

不仅开放 API,在硬件方面,腾讯会议也开放了很好的生态。为使音视频方面的核心能力得到充分发挥,腾讯会议开放音视频认证标准,通过天籁实验室对 All-in-one 触摸式一体机、音视频外设组合等设备进行专业化认证、优化。

 

腾讯天籁实验室总经理商世东表示:“当前,在线会议使用体验和面对面的沟通交流区别还是很大,在线会议还有很长的路要走,未来,我们相信 RTC 行业会达到这样的水平——让在线体验和现实体验尽可能接近”

2021-07-20 23:582871
用户头像

发布了 56 篇内容, 共 26.3 次阅读, 收获喜欢 43 次。

关注

评论

发布
暂无评论
发现更多内容

L1、L2范数理解--Ridge以及Lasso回归

Studying_swz

深度学习 11月月更

动态路由协议(二)

我叫于豆豆吖.

11月月更

东方通Tongweb中间件Linux环境部署

@下一站

技术 中间件 linux 文件权限控制 Java core 11月月更

融云「百幄」之数字人,升级交互体验的「新同事」

融云 RongCloud

AI 通信 数字化

通过阅读源码解决项目难题:GToken替换JWT实现SSO单点登录

王中阳Go

Go golang 高效工作 学习方法 11月月更

jvm(二)内存管理与虚拟机执行子系统

想要飞的猪

java对象内存布局 jvm加载子系统

2022下半年《软考-系统架构设计师》备考经验分享

劼哥stone

软考 系统架构师

冷冷清清的双十一,电商促销节为何被消费者逐渐抛弃

石头IT视角

应用链如何成为 Web3 的“潜力链”

One Block Community

区块链 开发者 区块链应用 云存储 web3

一次zuul版本升级产生的问题排查记录

骑牛上青山

Java spring 源码 Zuul 生产环境

JAVA concurrency -- ThreadLocal 源码详解

骑牛上青山

Java 源码

简单时序逻辑电路

智趣匠

Verilog 11月月更 锁存器

对于Ajax在MUI框架中的用运以及单 webview 模式中的下拉刷新功能探究

恒山其若陋兮

mui 11月月更

MUI框架的上拉加载的深入探索和实战运用

恒山其若陋兮

mui 11月月更

使用gitflow时如何合并hotfix

alps2006

Redis LRU 内存淘汰算法大有玄机

码哥字节

LRU Redis 6.0

链路状态路由协议 OSPF (一)

我叫于豆豆吖.

11月月更

流程表单初体验

江南一点雨

Java spring springboot flowable

OSPF路由协议一

初学者

11月月更

算法题学习---单链表的排序

桑榆

算法题 11月月更

Flowable 外置的 HTML 表单怎么玩?

江南一点雨

Java spring flowable JavaEE

2022-11-17:组合两个表。请写出sql语句,执行结果是{“headers“: [“first_name“, “last_name“, “city“, “state“], “values“: [

福大大架构师每日一题

数据库 福大大

JAVA concurrency -- CyclicBarrier 与 CountDownLatch 源码详解

骑牛上青山

Java 源码

动态路由协议(一)

我叫于豆豆吖.

11月月更

2022昇腾AI创新大赛圆满收官,看这届评委怎么说?

Geek_2d6073

为什么要做用户留存分析

穿过生命散发芬芳

用户留存 11月月更

Postman工具介绍

阿泽🧸

Postman 11月月更

【上】提高组件库Level必做好这六件事

小鑫同学

前端 组件库 11月月更

分布式系统中的哈希算法

骑牛上青山

数据结构 分布式 算法 哈希

uni-app 性能优化实战之逻辑层条件编译的生产环境

恒山其若陋兮

11月月更 uni

解读Web3公链发展格局

TinTinLand

区块链 以太坊 公链 多链

云视频会议“黑科技”,开放才是“硬”道理_文化 & 方法_张雅文_InfoQ精选文章