写点什么

云视频会议“黑科技”,开放才是“硬”道理

  • 2021-07-20
  • 本文字数:2026 字

    阅读完需:约 7 分钟

云视频会议“黑科技”,开放才是“硬”道理

疫情之下,“云办公”需求呈爆发式增长,推动RTC(实时音视频)行业迅速发展。进入后疫情时代,在线会议成为企业高效办公的标配。数据显示,协作时间占员工工作时间的 50%-80%。针对项目讨论或与客户进行沟通的小型协作空间数量未来将大幅增长。越来越多的企业衍生出线上线下协同开会的混合式会议需求,随之而来的问题是如何有效应对企业会议室复杂场景的开会难题。


多样性场景,在线会议挑战重重

 

传统在线会议产品更侧重于在企业内部沟通使用,形态上以专用设备和 PC 端居多。而当前的在线会议不再局限于内部,跨企业沟通需求呈爆发式增长。在线会议的接入场景也延伸到传统办公场景之外,用户希望不管从 Windows、IOS、安卓端甚至是电话的形式都可以轻轻松松接入在线的一个会议。

 

除终端以外,会议室本身也涵盖多种复杂的会议场景。如针对中小型会议室,要求聚焦于能完成相互之间沉浸式的互动讨论;针对大型会议室用户则希望能实现和远端清晰、无障碍的沟通,此外还有超大型会议室、培训室甚至开放办公空间等拥有不同需求的场景。

 

另外,不同行业的在线会议也存在不同的需求。比如,教育行业的双师教学场景下,在线会议要求做到多端接入,实现沉浸式的协作讲学;医疗行业的远程问诊场景下,则需要保证优质的传输质量,实现医生和病人的实时互动。如何满足不同行业场景下的多样化需求,也是在线会议面临的一大挑战。

 

硬件厂商困境,音频采集解决方案参差不齐

 

对于在线会议来说,提供高品质音视频是其核心能力。就目前而言,国内大屏厂商的音频采集解决方案音质参差不齐,距离国外一流的会议音频设备商音质有明显差距。

 

市面上很多硬件的实际拾音距离仅为 2 到 4 米左右。在远场情景下,讲话者会因离麦克风距离远,导致麦克风采集到的有效信号逐渐减弱,信噪比降低。因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。

 

除远距离拾音,会议室噪声问题也是很多硬件厂商无法解决的。设备热噪声、键盘噪声、空调噪声以及其他会议现场突发噪声几乎是不可避免的。

 

此外,当会议室场地空旷,声音经过玻璃和墙面的折射后产生反射声和混响,各类噪声也会严重影响到开会质量。在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。

 

技术突破,腾讯会议发布天籁语音模组方案

 

自 QQ 时代实现语音通话,腾讯在音视频领域已有超过 20 年的积累。持续不断的数据积累下,腾讯云将基于深度学习的技术模型和训练方法运用到端到端的音视频通信里面,对每个环节的具体技术进行升级改造,不断优化用户体验。基于此,2019 年 12 月 25 日,腾讯云发布云视频会议产品——腾讯会议。产品发布 1 个月左右,“宅家办公”令企业和个人对远程会议的需求爆发式增长。面对突如其来的巨大挑战,腾讯会议扛住压力,对产品进行迅速优化、迭代,上线仅 2 个月,日活用户超过 1000 万。

 

疫情趋于稳定后,腾讯会议将重心逐渐调整为功能和服务质量的提升。在音视频性能层面,腾讯会议利用 AI 算法和大数据分析能力,对音视频通话质量进行了全面提升。为了应对会议室场景各种复杂声学场景下的实时语音通信技术,腾讯会议旗下天籁实验室现针对大中型会议室的 All-In-One 大屏产品面临的远场双工通信的挑战,融合经典信号处理和端到端深度学习模型,发布天籁语音模组方案。

 

天籁语音模组基于软硬一体的声学硬件设计,通过麦克风阵列和多模态深度学习技术相融合,首次结合房间声场感知,采集和空间声场重建技术,开创性地解决会议室复杂场景下的实时音视频技术难题。其中,远距离拾音可达 12 米、突破性地将设备上行时延降低至几十毫秒、可消除键盘声、脚步声、开关门声等超过 200 种会议室常见噪音,并能实现双讲无剪切,无回声泄露,无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真,提升会议参与感。


开放技术能力,打造云视频会议生态

 

作为视频会议软件系统,腾讯会议可以和不同形态的硬件进行结合。为提升云视频会议体验,解决硬件厂商面临的问题,腾讯会议开放技术能力,积极与硬件厂商进行合作。

 

通过开放标准 API 接口以及二次开发,助力企业 IT、系统集成商等合作伙伴轻松适配多种会议场景,快速实现与腾讯会议的连接。企业可以根据预算、使用习惯、会议室规模,灵活购买官方认证的硬件终端来配置会议室,覆盖从独立行政办公室到大型培训教室的会议需求。数据显示,近万家企业通过接入腾讯会议 API,大幅提升不同场景的会议体验。

 

不仅开放 API,在硬件方面,腾讯会议也开放了很好的生态。为使音视频方面的核心能力得到充分发挥,腾讯会议开放音视频认证标准,通过天籁实验室对 All-in-one 触摸式一体机、音视频外设组合等设备进行专业化认证、优化。

 

腾讯天籁实验室总经理商世东表示:“当前,在线会议使用体验和面对面的沟通交流区别还是很大,在线会议还有很长的路要走,未来,我们相信 RTC 行业会达到这样的水平——让在线体验和现实体验尽可能接近”

2021-07-20 23:583279
用户头像

发布了 69 篇内容, 共 38.3 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

linux如何计算一个shell程序运行的时间

linux大本营

Shell Linux系统

点对点传输效率对比测试——镭速传输

镭速

汽车制造数字化转型如何做?有哪些可行性案例?

优秀

数字化转型 汽车制造

为什么企业们更偏好使用华为云CDN?

YG科技

Python中的哈希表

Echo_Wish

Python 数据结构 哈希表

智能感知编码优化与落地实践

Baidu AICLOUD

视频编解码

Go Mutex:保护并发访问共享资源的利器

陈明勇

Go golang mutex 互斥锁 三周年连更

文心一言 VS chatgpt (12)-- 算法导论3.1 6~7题

福大大架构师每日一题

ChatGPT 文心一言

写一个epoll的服务端程序

linux大本营

事件驱动 epoll C++ I/O 多路复用

使用Plist编辑器——简单入门指南

雪奈椰子

c语言如何用宏来实现字符串到函数的映射?

linux大本营

C语言 映射函数

华为弹性云服务器ECS,帮助企业节省成本上云成本

平平无奇爱好科技

云计算,

华为云全球加速GA,让企业获得更优质的服务体验

平平无奇爱好科技

CouldNOTfindGMP(missing:GMP_LIBRARYGMP_INCLUDE_DIR)CallStack(mostrecentcallfirst)

linux大本营

Linux GNU cmake

如何执行mysql文件

linux大本营

MySQL 数据库

对标阿里P8级Java面试题及答案整理(2023速成版,7天就能吃透)

收到请回复

华为云D-Plan解决方案助力汽车零部件质检智能化

轶天下事

constchar*类型的实参与char*类型的形参不兼容

linux大本营

指针 const C++

开心档之C++ 类 & 对象

雪奈椰子

ShareSDK QQ平台注册

MobTech袤博科技

华为云CDN加速为中小企业数字化效力

YG科技

Last Week in Milvus

Zilliz

Milvus Zilliz 向量数据库

华为云弹性公网IP服务,实惠又便捷!

轶天下事

华为云CDN,助力企业数字化转型

YG科技

云计算

斩获四奖|海泰方圆荣登网信自主创新尖锋榜

电子信息发烧客

TypeScript 函数 详解

程序员海军

Vue3 Typescript 三周年连更

2022-04-24:用go语言重写ffmpeg的muxing.c示例。

福大大架构师每日一题

Go 音视频 ffmpeg

【Python实战】Python采集最低战力信息

BROKEN

三周年连更

【Python实战】Python采集电影评论

BROKEN

三周年连更

华为云WAF设置要塞,筑起企业网络安全万里长城

轶天下事

华为云CDN:让网络延时,成为过去时!

YG科技

云视频会议“黑科技”,开放才是“硬”道理_文化 & 方法_张雅文_InfoQ精选文章