QCon 演讲火热征集中,快来分享你的技术实践与洞见! 了解详情
写点什么

专访融云杨攀:音视频技术的下半场,在于开发者服务生态

  • 2021-07-06
  • 本文字数:3881 字

    阅读完需:约 13 分钟

专访融云杨攀:音视频技术的下半场,在于开发者服务生态

采访嘉宾 | 杨攀

编辑 | Tina


音视频的大时代正在加速到来。


经历了 2016 年的直播风口,2018 的短视频风口,以及疫情后更大的线上场景爆发潮,音视频已经成为了各个行业的基础设施。会议、教学、销售等各种场景都被搬到了线上,音视频应用领域战成了一片红海。与之前相比,最近这波爆发下的场景涉及到的技术更为复杂,不再仅是基于 CDN 的推拉流,而是以实时交互的 RTC 技术为主。


今年初,火爆的音频聊天应用 Clubhouse 宣布完成 C 轮融资,估值达到了 40 亿美元。伴随着 Clubhouse 优异表现,开始出现越来越多的语聊房产品,风口下谁能快速完成搭建率先推出类似功能,谁就能赢取大批用户。激烈竞争下尤其考验到各家的技术能力,像融云这样的位列实时音视频技术第一阵营的服务商也迅速浮出水面。


为探讨音视频技术发展以及未来趋势,InfoQ 采访了融云联合创始人兼 CTO 杨攀。他将在 2021 全球互联网通信云大会(WICC)发表《以通信为核心的开发者服务生态探索》的演讲。


采访嘉宾简介:


杨攀,融云联合创始人兼 CTO。大规模高并发通信和社交平台领域专家。早期主要从事电信 SP 行业的工作,中国最早的一批 .NET 开发者,参与了 MSN Mobile China Hub 的开发管理工作,后加入神州泰岳飞信团队,先后负责了飞信的社交平台、开放平台、即时通讯平台的研发管理工作。2014 年联合创立融云,向开发者提供面向全球的即时通讯和实时音视频云服务。目前在融云主要负责公司的产品和研发的工作。


RTC 技术的爆发


疫情以来,由于大部分场景转到线上,极快地催热了整个实时音视频在各个行业的落地应用。再加上数字化转型升级浪潮下,各企业为了适应业务创新的需求,需要变革通信方式,企业内外部沟通已从早期单纯的话音、短信等逐渐发展为基于互联网形式的即时通讯、实时音视频等多种交互方式。实时通信使用量激增,实时音视频技术也上升到一个全新的高度。


为了顺应时势,今年 1 月,W3C 和 IETF 制定颁布了 WebRTC 标准,这是一个里程碑性的事件。WebRTC 是线上通信及协作服务的基石,WebRTC 标准正式发布之前,各个厂商有几种做法:一种是用私有的方案和协议,另一种是遵循这个标准来做。还有一种中间状态,就是基于 WebRTC 标准,再加上自己的一些技术方案进行一些定制,但一些修改并不跟官方的标准兼容。有了统一的标准之后,利于音视频能力的普及,更有望实现自由地在互联网上进行实时音视频传输。


需求的爆发促进了标准的推出,杨攀在接受采访时对 InfoQ 表示:“明显感觉到这两年,无论是技术研发还是这个标准的推出都在大大地加速。这跟整个这个产业对音视频通讯的诉求非常强烈也有关系,起着互相推动的作用。”


融云从成立的第一天开始就兼容 WebRTC 标准。WebRTC 标准官方定义了一个端到端之间如何进行音视频通话,包含基本的音频处理、视频处理、降噪处理等,融云在此基础上又做了很多针对音视频质量和弱网处理的具体优化和功能提升。


弱网是互联网上是一个比较普遍的现象。比如说在室外使用 4G、5G 流量,如果有因为环境造成的信号不稳定的情况下,通过动态调整码率、FEC、NACK 等策略来保证音视频通讯过程中的质量。如果这些做不好,就无法形成最基础的服务。


实际到具体场景下,一定会涉及到通讯网络,通过一些服务器的中转服务,个人开发者实现这些服务几乎是不可能的,只能通过一些第三方开源项目。但这些第三方开源项目,普遍未经过生产级别的海量业务压力测试。用户数变多、并发变高、用户覆盖区域变广以后,那么绝大多数的开源项目都没法直接满足需求。这时就需要融云这样的云服务厂商来解决云端的通讯网络质量和调度策略方面的事情。也就是说,实现企业级通信服务并非难事,但如何在高并发、大流量的情况下依然能够保证正常运行才是核心所在。


为何要统一为一套 SDK


融云是最早的一批提供即时通讯云服务的企业之一。依赖于团队之前在通讯领域里做过亿级活跃用户规模的 IM 项目经验,能保证系统的消息不丢、不重复、不乱序,融云很快成为了中国第三大即时通讯平台,仅排在微信和 QQ 之后。


在服务用户的过程中,融云发现社交的玩法与场景逐渐多元,开发者和一些企业进行软件开发时,越来越多的开发者同时需要 IM、音视频、推送三种功能场景的能力。


2020 年,融云推出了“IM 即时通讯+RTC 实时音视频+PUSH 推送”的一体化解决方案,“用一套 SDK ,解决所有通信场景”,让开发者能用同一个 SDK 进行开发,使用共同的后台服务、前端接口、计费排查工具,能降低运营难度和使用成本。


像语聊房之所以能被各企业快速的搭建起来,技术的推动是一个重要的因素,以融云融合 IM 和音视频的语聊房 SDK 为例,开发者利用这样一套 SDK,可以在 30 分钟内快速集成语聊房场景能力。


对于如何在行业领域里建立技术壁垒,杨攀认为其中一个关键在于:“能够跟上整个时代发展潮流,快速的响应,为客户提供最佳的解决方案。”


5G 的发展给基础设施带来了低延迟、高带宽、高并发性能上的提升,那么从技术上,我们就可以处理更高分辨率的视频,得到更好的音质,而这些方面对音视频编解码提出了更高的要求。伴随 5G 的场景变化,给整个产业也带来了非常大的变化,原来因为成本的问题没法做的,现在都可以进行海量应用了。


比如说 5G 技术给 VR 和云游戏提供了很好的网络基础设施,VR 传输的视频信息量是传统的视频体系量的若干倍,而云游戏也不再需要下载很大的游戏包到本地,现在依靠音视频实时通信的技术,把远端的服务器上的运行的游戏画面实时传回到用户侧,再通过用户操作实时通过信令的方式传回到引擎,可以实现在线玩游戏。这就需要适应整个技术趋势,在通信承载能力上,包括视频、音频质量处理的能力,去做持续的改进。同时也要适应客户的终端上的改变,从显示屏和手机屏幕,再到以后的 AR、VR、XR 终端。


另一方面,人工智能也对音视频有很多优化。现在音视频优化算法都或多或少引入了一些人工智能降噪技术来提高音频、视频质量。另外一方面是基于人工智能的一些具体的业务场景需求,比如说虚拟人像、虚拟声音的合成处理、实时美颜、实时美声,融云需要对应地提供这些功能的插件,需要在 SDK 和服务端这一侧开放足够多的接口 API,支持这样的一些服务。而且还需要为未来每个可能出现的场景,给开发者推出针对性的 SDK。


杨攀表示:“在遵循业内标准的前提下,我们所有的技术都是完全由自己核心掌握的,相关的代码都是自融云创立以后重新正向开发的,所以面对客户的最新的需求的时候,我们往往可以第一时间给客户提供具体的解决方案,或者根据客户的需求快速迭代出新的产品功能、开发支持,甚至可以做到以周为单位给客户提供新的功能。保持快速迭代的同时,通过这些年的积累,各种接口成为了业界最全的,接口数量在业内也是遥遥领先的。这些都是开发者服务厂商的核心竞争力。”


技术与服务并重


目前融云的这套集“IM 即时通讯+RTC 实时音视频+PUSH 推送”于一体的解决方案已经迭代到了第五代,早期通过一些输入验证了核心技术点,后边几次迭代逐步提升通信服务质量,以及对开发者的接口友好度,让开发者能够以更低的成本、更快速集成和使用这些 SDK。


提供稳定安全的服务最基础的体现是在整个产品服务的运维体系和开发的流程方面。线上产品在运维的过程中,是否有足够多的监控,发布流程、升级过程是否足够的科学稳定,本身架构的设计是否足够的健壮,这些都是用来保障安全稳定服务的基础。


另外一方面,在整个的产品的周期范围内,通过一定的机制能第一时间发现并快速解决问题,这也是一个非常重要的能力。杨攀讲道:“真正的 2B 的业务包括两个方面,一是有没有技术实力能解决客户的问题。二是对客户本身的业务是否有足够的理解。我们需要在开发者发现问题之前,把出现的问题解决掉。”


稳定可靠的技术优势,赢回来的就是口碑。客户用了产品,体验好的话必定会再推荐给别人。


在开发者服务这个领域,口碑远远比市场的品牌营销、市场的宣传更重要。因为开发者都是非常理性的群体,他们使用之前往往都会问一下身边的人。杨攀解释说,融云这些年来不断的扩展,在市场宣传方面投入的经费,可以说是远远低于其他的厂商,客户数、市场占有率的提高,都是口碑传播的效果。


中国的开发者服务产业,还属于早期阶段。市场竞争会越来越激烈,人力成本也越来越高,人力成本的提高,最大的促进因素在 2B 行业,也就是帮别人解决问题的需求会越来越多,因为帮别人解决问题是在降低他的成本。越是竞争激烈的行业越需要去优化自己的成本结构,提高自己的效率,也就越需要找更低成本的第三方来替代自己的工作,杨攀认为开发者服务行业迟早会迎来爆发阶段。


融云从 2014 年开始就进入这个领域,可以算是开发者服务领域里面比较早期的厂商,多年来积累了开发者服务行业的各种经验和案例。在 WICC 2021 大会,杨攀将为开发者分享融云关于开发者服务生态的思考,围绕国内开发者服务产业现状、开发者需求分析、融云开发者服务体系建设等多方面展开。同时,也会和其他几位重磅嘉宾一起以“开发者生态”为主题进行高峰对话。


本次大会主要聚焦通信云领域的尖端技术,尤其是音视频领域的新技术与应用,分享在线教育、社交泛娱乐等多行业的最佳实践思考,主要价值在于更广泛地开拓开发者视野和更好地服务开发者生态。会议设有三个分论坛:“网络传输和系统架构”、“RTC 新技术与应用”、“场景化赋能与创新” 。除了分论坛的众多业界技术大咖之外,还请来了清华大学计算机科学与技术系的长聘教授孙立峰,他将带来《互联网音视频服务:从 AI 赋能到智慧内生》的主题演讲;以及北京大学的副教授张行功博士,他将带来《虚拟现实视频的应用和技术》的内容分享。了解详情:https://wicc.rongcloud.cn/2021/index?track=infoq2



2021-07-06 17:252528

评论

发布
暂无评论
发现更多内容

Apache Flink 在移动云实时计算的实践

Apache Flink

大数据 flink 开源 编程 实时计算

深度文 | 一文看懂云原生时代 DevOps 如何选型

星汉未来

运维 云原生 降本增效

云原生背景下的应用安全建设

火线安全

云原生 云安全

Shopee Games 游戏引擎演进之路

Shopee技术团队

前端 游戏开发 egret 游戏引擎

TiDB 5.4 发版丨新功能解读

PingCAP

科创人·弘玑Cyclone CEO高煜光:从RPA到超自动化,以客户需求构建战略纵深

科创人

fastposter v2.5.1 发布 轻松在线作图

物有本末

基于Java+SpringMVC+MySql+Layui+H5实现企业门户网站

Geek_7jiynf

网站建设

福昕软件与中国船级社签署框架合作协议,共建数字船舶发展新高地

联营汇聚

带你掌握Redis数据类型:string和Hash

华为云开发者联盟

redis string hash 数据类型

MongoDB常见问题解答:时间与时区

MongoDB中文社区

mongodb

进入2022年,移动互联网的小程序和短视频直播赛道还有机会吗?

BeeWorks

理想很丰满,现实很骨感,坎坷前行的区块链产业化路在何方?

Akumas

区块链 数字化转型 新基建 十四五规划

【C语言】结构体

謓泽

C语言 结构体 3月月更

车辆GPS定位整套管理系统,轨迹播放,车辆管理,电子围栏,报警记录,数据库/人员定位/宠物定位/物流跟踪/资产定位

Geek_7jiynf

Java Java web GPS

基于大数据的医疗健康疾病筛查及风险评估系统

Geek_7jiynf

医疗方案 医疗AI 医疗信息化

网络安全:小记一次代码审计

网络安全学海

网络安全 信息安全 渗透测试 安全漏洞 代码审计

恒源云(Gpushare)_UNIRE:一种可以共享标签空间的方法

恒源云

OpenCV 计算机视觉 服务器

高级IO模型之kqueue和epoll

程序那些事

Java io nio 程序那些事 3月月更

记某核心MongoDB集群索引优化实践

MongoDB中文社区

mongodb

加入XTransfer,和技术大咖一起大展身手!

XTransfer技术

程序员 招聘 跨境支付

【数据库】云数据库rds是什么意思?有什么优势?

行云管家

数据库 云数据库 RDS

【云计算】云计算六大优点简单说明

行云管家

云计算 IT 企业上云 IT运维

云开发在教育应用开发、运维全流程实践

阿里云云效

云计算 阿里云 DevOps 云原生 开发

数字化背景下,为何J2PaaS低代码平台,能成为企业技术升级的优选?

J2PaaS低代码平台

低代码 数字化 企业数字化转型 低代码平台 企业级低代码平台

JAVA只要掌握内部类,多继承和单继承都不是问题

华为云开发者联盟

Java jdk 多继承 内部类 单继承

直播系统聊天技术(七):直播间海量聊天消息的架构设计难点实践

BeeWorks

如何为招聘机构选择CRM系统

低代码小观

低代码 企业管理 企业管理系统 CRM系统

通过蜜罐技术获取攻击者手机号、微信号【网络安全】

H

黑客 网络安全

什么是SDK,它是怎样威胁我们的隐私?

郑州埃文科技

一次代码审计实战案例【思路流程】

H

网络安全

专访融云杨攀:音视频技术的下半场,在于开发者服务生态_语言 & 开发_Tina_InfoQ精选文章