2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

云视频会议“黑科技”,开放才是“硬”道理

  • 2021-07-20
  • 本文字数:2026 字

    阅读完需:约 7 分钟

云视频会议“黑科技”,开放才是“硬”道理

疫情之下,“云办公”需求呈爆发式增长,推动RTC(实时音视频)行业迅速发展。进入后疫情时代,在线会议成为企业高效办公的标配。数据显示,协作时间占员工工作时间的 50%-80%。针对项目讨论或与客户进行沟通的小型协作空间数量未来将大幅增长。越来越多的企业衍生出线上线下协同开会的混合式会议需求,随之而来的问题是如何有效应对企业会议室复杂场景的开会难题。


多样性场景,在线会议挑战重重

 

传统在线会议产品更侧重于在企业内部沟通使用,形态上以专用设备和 PC 端居多。而当前的在线会议不再局限于内部,跨企业沟通需求呈爆发式增长。在线会议的接入场景也延伸到传统办公场景之外,用户希望不管从 Windows、IOS、安卓端甚至是电话的形式都可以轻轻松松接入在线的一个会议。

 

除终端以外,会议室本身也涵盖多种复杂的会议场景。如针对中小型会议室,要求聚焦于能完成相互之间沉浸式的互动讨论;针对大型会议室用户则希望能实现和远端清晰、无障碍的沟通,此外还有超大型会议室、培训室甚至开放办公空间等拥有不同需求的场景。

 

另外,不同行业的在线会议也存在不同的需求。比如,教育行业的双师教学场景下,在线会议要求做到多端接入,实现沉浸式的协作讲学;医疗行业的远程问诊场景下,则需要保证优质的传输质量,实现医生和病人的实时互动。如何满足不同行业场景下的多样化需求,也是在线会议面临的一大挑战。

 

硬件厂商困境,音频采集解决方案参差不齐

 

对于在线会议来说,提供高品质音视频是其核心能力。就目前而言,国内大屏厂商的音频采集解决方案音质参差不齐,距离国外一流的会议音频设备商音质有明显差距。

 

市面上很多硬件的实际拾音距离仅为 2 到 4 米左右。在远场情景下,讲话者会因离麦克风距离远,导致麦克风采集到的有效信号逐渐减弱,信噪比降低。因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。

 

除远距离拾音,会议室噪声问题也是很多硬件厂商无法解决的。设备热噪声、键盘噪声、空调噪声以及其他会议现场突发噪声几乎是不可避免的。

 

此外,当会议室场地空旷,声音经过玻璃和墙面的折射后产生反射声和混响,各类噪声也会严重影响到开会质量。在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。

 

技术突破,腾讯会议发布天籁语音模组方案

 

自 QQ 时代实现语音通话,腾讯在音视频领域已有超过 20 年的积累。持续不断的数据积累下,腾讯云将基于深度学习的技术模型和训练方法运用到端到端的音视频通信里面,对每个环节的具体技术进行升级改造,不断优化用户体验。基于此,2019 年 12 月 25 日,腾讯云发布云视频会议产品——腾讯会议。产品发布 1 个月左右,“宅家办公”令企业和个人对远程会议的需求爆发式增长。面对突如其来的巨大挑战,腾讯会议扛住压力,对产品进行迅速优化、迭代,上线仅 2 个月,日活用户超过 1000 万。

 

疫情趋于稳定后,腾讯会议将重心逐渐调整为功能和服务质量的提升。在音视频性能层面,腾讯会议利用 AI 算法和大数据分析能力,对音视频通话质量进行了全面提升。为了应对会议室场景各种复杂声学场景下的实时语音通信技术,腾讯会议旗下天籁实验室现针对大中型会议室的 All-In-One 大屏产品面临的远场双工通信的挑战,融合经典信号处理和端到端深度学习模型,发布天籁语音模组方案。

 

天籁语音模组基于软硬一体的声学硬件设计,通过麦克风阵列和多模态深度学习技术相融合,首次结合房间声场感知,采集和空间声场重建技术,开创性地解决会议室复杂场景下的实时音视频技术难题。其中,远距离拾音可达 12 米、突破性地将设备上行时延降低至几十毫秒、可消除键盘声、脚步声、开关门声等超过 200 种会议室常见噪音,并能实现双讲无剪切,无回声泄露,无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真,提升会议参与感。


开放技术能力,打造云视频会议生态

 

作为视频会议软件系统,腾讯会议可以和不同形态的硬件进行结合。为提升云视频会议体验,解决硬件厂商面临的问题,腾讯会议开放技术能力,积极与硬件厂商进行合作。

 

通过开放标准 API 接口以及二次开发,助力企业 IT、系统集成商等合作伙伴轻松适配多种会议场景,快速实现与腾讯会议的连接。企业可以根据预算、使用习惯、会议室规模,灵活购买官方认证的硬件终端来配置会议室,覆盖从独立行政办公室到大型培训教室的会议需求。数据显示,近万家企业通过接入腾讯会议 API,大幅提升不同场景的会议体验。

 

不仅开放 API,在硬件方面,腾讯会议也开放了很好的生态。为使音视频方面的核心能力得到充分发挥,腾讯会议开放音视频认证标准,通过天籁实验室对 All-in-one 触摸式一体机、音视频外设组合等设备进行专业化认证、优化。

 

腾讯天籁实验室总经理商世东表示:“当前,在线会议使用体验和面对面的沟通交流区别还是很大,在线会议还有很长的路要走,未来,我们相信 RTC 行业会达到这样的水平——让在线体验和现实体验尽可能接近”

2021-07-20 23:583410
用户头像

发布了 91 篇内容, 共 53.2 次阅读, 收获喜欢 57 次。

关注

评论

发布
暂无评论
发现更多内容

优化大宽表查询性能,揭秘GaussDB(DWS) 谓词列analyze

华为云开发者联盟

GaussDB #数据库 analyze

性能优化!突破性能瓶颈的尖兵CPU Cache

不在线第一只蜗牛

性能优化

ByConity BSP 解锁数据仓库新未来

网罗开发

聚力创新|首届BIOV生命科技与再生医疗国际峰会在泰国曼谷圆满举行

TechubNews

华为ensp--BGP路由黑洞

阿落ovo

阿里发布多模态推理模型 QVQ-72B,视觉、语言能力双提升;OpenAI 正在研发人形机器人丨 RTE 开发者日报

声网

三面滴滴失败,总结了Java面试题,有几个题还是一直搞不懂

Summer

Java 程序员 面试 架构师 大厂

2024年OpenTiny年度人气贡献者评选正式开始

OpenTiny社区

开源 前端 OpenTiny

阿里大佬翻遍全网Java面试文章,总结出这份1658页文档,GitHub收获25K+点赞

Summer

Java 程序员 面试 架构师 大厂

2024数据库编程大赛-八强决赛成绩揭晓

NineData

Doris NineData 第二届数据库编程大赛

指标管理+AI大模型深度融合,开启智能数据分析管理新时代

袋鼠云数栈

向量检索的3种方式

DashVector

人工智能 数据库 向量检索 大模型

轻至986g,续航18小时、120TOPS算力!ThinkPad X1 Carbon Aura AI元启版刷新商务AI PC巅峰体验

科技范儿

YOLOv5 的量化流程及部署方法

地平线开发者

自动驾驶 算法 地平线征程5 地平线征程6

Flexus云服务器X实例赋能,用Python将微信公众号秒变智能聊天机器人

轶天下事

大语言模型的上下文窗口 (Context Windows)

澳鹏Appen

文本生成 LLM 大语言模型

Gate.io 平台通证 GT:持续赋能与销毁、财富效应显著

股市老人

出海电商如何解决网络问题

Ogcloud

SD-WAN 跨境电商网络 外贸网络 SD-WAN国际专线 国际网络专线

全新红娘交友系统定制版源码| 相亲交友小程序源码全开源可二开_

DUOKE七七

php 开源 uniapp

部署有声读物和播客的自托管媒体服务器Audiobookshelf

轶天下事

探索Flink动态CEP:杭州银行的实战案例

Apache Flink

大数据 flink 数据分析 CEP 实时处理

剖析——陪玩源码,陪玩平台搭建的各种必备功能与收益来源,游戏陪玩系统源码

DUOKE七七

php 开源 uniapp 陪玩系统源码

华为阅读年度榜单揭晓:汇聚精品内容,打造沉浸式阅读盛宴

最新动态

华为云Flexus X实例使用教学——完整的配置选择与实操步骤讲解

轶天下事

向量更新的3种方式

DashVector

人工智能 数据库 大模型

Altair RapidMiner 解锁更高级别的功能,支持用户无缝构建和部署高级 AI agent

Altair RapidMiner

机器学习 #人工智能 altair #数据分析 RapidMiner

如何找到可靠的海外云服务器租用商

Ogcloud

云服务器 香港云服务器 美国云服务器 海外云服务器 云服务器租用

云视频会议“黑科技”,开放才是“硬”道理_文化 & 方法_张雅文_InfoQ精选文章