AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

云视频会议“黑科技”,开放才是“硬”道理

  • 2021-07-20
  • 本文字数:2026 字

    阅读完需:约 7 分钟

云视频会议“黑科技”,开放才是“硬”道理

疫情之下,“云办公”需求呈爆发式增长,推动RTC(实时音视频)行业迅速发展。进入后疫情时代,在线会议成为企业高效办公的标配。数据显示,协作时间占员工工作时间的 50%-80%。针对项目讨论或与客户进行沟通的小型协作空间数量未来将大幅增长。越来越多的企业衍生出线上线下协同开会的混合式会议需求,随之而来的问题是如何有效应对企业会议室复杂场景的开会难题。


多样性场景,在线会议挑战重重

 

传统在线会议产品更侧重于在企业内部沟通使用,形态上以专用设备和 PC 端居多。而当前的在线会议不再局限于内部,跨企业沟通需求呈爆发式增长。在线会议的接入场景也延伸到传统办公场景之外,用户希望不管从 Windows、IOS、安卓端甚至是电话的形式都可以轻轻松松接入在线的一个会议。

 

除终端以外,会议室本身也涵盖多种复杂的会议场景。如针对中小型会议室,要求聚焦于能完成相互之间沉浸式的互动讨论;针对大型会议室用户则希望能实现和远端清晰、无障碍的沟通,此外还有超大型会议室、培训室甚至开放办公空间等拥有不同需求的场景。

 

另外,不同行业的在线会议也存在不同的需求。比如,教育行业的双师教学场景下,在线会议要求做到多端接入,实现沉浸式的协作讲学;医疗行业的远程问诊场景下,则需要保证优质的传输质量,实现医生和病人的实时互动。如何满足不同行业场景下的多样化需求,也是在线会议面临的一大挑战。

 

硬件厂商困境,音频采集解决方案参差不齐

 

对于在线会议来说,提供高品质音视频是其核心能力。就目前而言,国内大屏厂商的音频采集解决方案音质参差不齐,距离国外一流的会议音频设备商音质有明显差距。

 

市面上很多硬件的实际拾音距离仅为 2 到 4 米左右。在远场情景下,讲话者会因离麦克风距离远,导致麦克风采集到的有效信号逐渐减弱,信噪比降低。因此参加企业培训、工作汇报等企业会议时,最常见的一个现象就是听不清甚至听不到。

 

除远距离拾音,会议室噪声问题也是很多硬件厂商无法解决的。设备热噪声、键盘噪声、空调噪声以及其他会议现场突发噪声几乎是不可避免的。

 

此外,当会议室场地空旷,声音经过玻璃和墙面的折射后产生反射声和混响,各类噪声也会严重影响到开会质量。在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。

 

技术突破,腾讯会议发布天籁语音模组方案

 

自 QQ 时代实现语音通话,腾讯在音视频领域已有超过 20 年的积累。持续不断的数据积累下,腾讯云将基于深度学习的技术模型和训练方法运用到端到端的音视频通信里面,对每个环节的具体技术进行升级改造,不断优化用户体验。基于此,2019 年 12 月 25 日,腾讯云发布云视频会议产品——腾讯会议。产品发布 1 个月左右,“宅家办公”令企业和个人对远程会议的需求爆发式增长。面对突如其来的巨大挑战,腾讯会议扛住压力,对产品进行迅速优化、迭代,上线仅 2 个月,日活用户超过 1000 万。

 

疫情趋于稳定后,腾讯会议将重心逐渐调整为功能和服务质量的提升。在音视频性能层面,腾讯会议利用 AI 算法和大数据分析能力,对音视频通话质量进行了全面提升。为了应对会议室场景各种复杂声学场景下的实时语音通信技术,腾讯会议旗下天籁实验室现针对大中型会议室的 All-In-One 大屏产品面临的远场双工通信的挑战,融合经典信号处理和端到端深度学习模型,发布天籁语音模组方案。

 

天籁语音模组基于软硬一体的声学硬件设计,通过麦克风阵列和多模态深度学习技术相融合,首次结合房间声场感知,采集和空间声场重建技术,开创性地解决会议室复杂场景下的实时音视频技术难题。其中,远距离拾音可达 12 米、突破性地将设备上行时延降低至几十毫秒、可消除键盘声、脚步声、开关门声等超过 200 种会议室常见噪音,并能实现双讲无剪切,无回声泄露,无近端语音抑制,有效确保多人讨论时,每个人的声音都听得见、听得清、听得真,提升会议参与感。


开放技术能力,打造云视频会议生态

 

作为视频会议软件系统,腾讯会议可以和不同形态的硬件进行结合。为提升云视频会议体验,解决硬件厂商面临的问题,腾讯会议开放技术能力,积极与硬件厂商进行合作。

 

通过开放标准 API 接口以及二次开发,助力企业 IT、系统集成商等合作伙伴轻松适配多种会议场景,快速实现与腾讯会议的连接。企业可以根据预算、使用习惯、会议室规模,灵活购买官方认证的硬件终端来配置会议室,覆盖从独立行政办公室到大型培训教室的会议需求。数据显示,近万家企业通过接入腾讯会议 API,大幅提升不同场景的会议体验。

 

不仅开放 API,在硬件方面,腾讯会议也开放了很好的生态。为使音视频方面的核心能力得到充分发挥,腾讯会议开放音视频认证标准,通过天籁实验室对 All-in-one 触摸式一体机、音视频外设组合等设备进行专业化认证、优化。

 

腾讯天籁实验室总经理商世东表示:“当前,在线会议使用体验和面对面的沟通交流区别还是很大,在线会议还有很长的路要走,未来,我们相信 RTC 行业会达到这样的水平——让在线体验和现实体验尽可能接近”

2021-07-20 23:583426
用户头像

发布了 91 篇内容, 共 54.0 次阅读, 收获喜欢 57 次。

关注

评论

发布
暂无评论
发现更多内容

大数据软件开发培训中心哪家好

小谷哥

官宣:计算中间件 Apache Linkis 正式毕业成为 Apache 顶级项目

腾源会

开源

品牌不得不投放户外LED广告的原因

Dylan

LED显示屏 户外LED显示屏 led显示屏厂家

程序员培训后怎么能够在一线城市找到工作?

小谷哥

大文件传输软件的优势有哪些?-镭速传输

镭速

我发现买不起自己出版的图书了,这到底是咋回事?

冰河

程序员 并发编程 高并发 架构师 编程开发

前端技术培训学习的就业怎么样?

小谷哥

深度 | Web 3.0时代去中心化IM 的挑战与思考

环信

Web3.0 环信im

青云 KubeSphere 与 OpenCloudOS 完成技术兼容互认证

OpenCloudOS

云原生 操作系统 KubeSphere

基于ModelArts进行流感患者密接排查

华为云开发者联盟

人工智能 华为云 行人检测 企业号 2 月 PK 榜 华为云开发者联盟

对话阿里云叔同:如何看待 2022 年云原生的发展,2023 年有哪些值得关注的技术?

阿里巴巴中间件

阿里云 云原生

干货|常用3D建模软件有哪些?

Finovy Cloud

3DMAX Autodesk Maya 3D软件

Apipost预执行脚本使用教程

徐天

Intel官方回应:处理器降价消息不实!全力减少库存

科技之家

MoBYv2AL :结合 BOYL 和 MoCo 的主动学习算法

Zilliz

C#/VB.NET 在Excel中添加水印

在下毛毛雨

C# .net Excel 添加水印

金兔迎福报、新春第一炮【2022 中国开源年度报告】!

腾源会

开源

快速入门pandas进行数据挖掘数据分析[多维度排序、数据筛选、分组计算、透视表](一)

汀丶人工智能

Python 数据挖掘 数据分析 pandas

软件测试/测试开发 | app自动化测试(Android)—Capability 使用进阶

测试人

软件测试 自动化测试 测试开发 appium app自动化测试

为啥要对jvm做优化

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

解锁极狐GitLab 自动化功能:Webhook 触发 Pipeline 与计划流水线

极狐GitLab

DevOps pipeline ChatOps webhook ChatGPT

构建工具tsup入门第一部分

小鑫同学

前端 编译 工具链

看板:自我管理的高效工具!

敏捷开发

项目管理 软件开发 看板

前端培训机构毕业后该注意什么?

小谷哥

2/8 19:00 直播 | StarRocks 实战系列第一期--部署&导入

StarRocks

数据库

云小课|GaussDB如何进行性能调优

华为云开发者联盟

数据库 后端 华为云 企业号 2 月 PK 榜 华为云开发者联盟

深入浅出学习透析Nginx服务器的架构分析及原理分析「底层技术原理+运作架构机制」

C++后台开发

nginx 负载均衡 中间件 后端开发 Linux服务器开发

前端程序员就业方向有哪些?

小谷哥

基于 Flink+Pravega 的游戏服务器监控与调节系统设计

Apache Flink

大数据 flink 实时计算

跬智信息 (Kyligence) 入选2022年度上海市优质大数据服务供应商目录

Kyligence

大数据 数据分析

小白科普丨何为树、二叉树和森林

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

云视频会议“黑科技”,开放才是“硬”道理_文化 & 方法_张雅文_InfoQ精选文章