NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

专访融云杨攀:音视频技术的下半场,在于开发者服务生态

  • 2021-07-06
  • 本文字数:3881 字

    阅读完需:约 13 分钟

专访融云杨攀:音视频技术的下半场,在于开发者服务生态

采访嘉宾 | 杨攀

编辑 | Tina


音视频的大时代正在加速到来。


经历了 2016 年的直播风口,2018 的短视频风口,以及疫情后更大的线上场景爆发潮,音视频已经成为了各个行业的基础设施。会议、教学、销售等各种场景都被搬到了线上,音视频应用领域战成了一片红海。与之前相比,最近这波爆发下的场景涉及到的技术更为复杂,不再仅是基于 CDN 的推拉流,而是以实时交互的 RTC 技术为主。


今年初,火爆的音频聊天应用 Clubhouse 宣布完成 C 轮融资,估值达到了 40 亿美元。伴随着 Clubhouse 优异表现,开始出现越来越多的语聊房产品,风口下谁能快速完成搭建率先推出类似功能,谁就能赢取大批用户。激烈竞争下尤其考验到各家的技术能力,像融云这样的位列实时音视频技术第一阵营的服务商也迅速浮出水面。


为探讨音视频技术发展以及未来趋势,InfoQ 采访了融云联合创始人兼 CTO 杨攀。他将在 2021 全球互联网通信云大会(WICC)发表《以通信为核心的开发者服务生态探索》的演讲。


采访嘉宾简介:


杨攀,融云联合创始人兼 CTO。大规模高并发通信和社交平台领域专家。早期主要从事电信 SP 行业的工作,中国最早的一批 .NET 开发者,参与了 MSN Mobile China Hub 的开发管理工作,后加入神州泰岳飞信团队,先后负责了飞信的社交平台、开放平台、即时通讯平台的研发管理工作。2014 年联合创立融云,向开发者提供面向全球的即时通讯和实时音视频云服务。目前在融云主要负责公司的产品和研发的工作。


RTC 技术的爆发


疫情以来,由于大部分场景转到线上,极快地催热了整个实时音视频在各个行业的落地应用。再加上数字化转型升级浪潮下,各企业为了适应业务创新的需求,需要变革通信方式,企业内外部沟通已从早期单纯的话音、短信等逐渐发展为基于互联网形式的即时通讯、实时音视频等多种交互方式。实时通信使用量激增,实时音视频技术也上升到一个全新的高度。


为了顺应时势,今年 1 月,W3C 和 IETF 制定颁布了 WebRTC 标准,这是一个里程碑性的事件。WebRTC 是线上通信及协作服务的基石,WebRTC 标准正式发布之前,各个厂商有几种做法:一种是用私有的方案和协议,另一种是遵循这个标准来做。还有一种中间状态,就是基于 WebRTC 标准,再加上自己的一些技术方案进行一些定制,但一些修改并不跟官方的标准兼容。有了统一的标准之后,利于音视频能力的普及,更有望实现自由地在互联网上进行实时音视频传输。


需求的爆发促进了标准的推出,杨攀在接受采访时对 InfoQ 表示:“明显感觉到这两年,无论是技术研发还是这个标准的推出都在大大地加速。这跟整个这个产业对音视频通讯的诉求非常强烈也有关系,起着互相推动的作用。”


融云从成立的第一天开始就兼容 WebRTC 标准。WebRTC 标准官方定义了一个端到端之间如何进行音视频通话,包含基本的音频处理、视频处理、降噪处理等,融云在此基础上又做了很多针对音视频质量和弱网处理的具体优化和功能提升。


弱网是互联网上是一个比较普遍的现象。比如说在室外使用 4G、5G 流量,如果有因为环境造成的信号不稳定的情况下,通过动态调整码率、FEC、NACK 等策略来保证音视频通讯过程中的质量。如果这些做不好,就无法形成最基础的服务。


实际到具体场景下,一定会涉及到通讯网络,通过一些服务器的中转服务,个人开发者实现这些服务几乎是不可能的,只能通过一些第三方开源项目。但这些第三方开源项目,普遍未经过生产级别的海量业务压力测试。用户数变多、并发变高、用户覆盖区域变广以后,那么绝大多数的开源项目都没法直接满足需求。这时就需要融云这样的云服务厂商来解决云端的通讯网络质量和调度策略方面的事情。也就是说,实现企业级通信服务并非难事,但如何在高并发、大流量的情况下依然能够保证正常运行才是核心所在。


为何要统一为一套 SDK


融云是最早的一批提供即时通讯云服务的企业之一。依赖于团队之前在通讯领域里做过亿级活跃用户规模的 IM 项目经验,能保证系统的消息不丢、不重复、不乱序,融云很快成为了中国第三大即时通讯平台,仅排在微信和 QQ 之后。


在服务用户的过程中,融云发现社交的玩法与场景逐渐多元,开发者和一些企业进行软件开发时,越来越多的开发者同时需要 IM、音视频、推送三种功能场景的能力。


2020 年,融云推出了“IM 即时通讯+RTC 实时音视频+PUSH 推送”的一体化解决方案,“用一套 SDK ,解决所有通信场景”,让开发者能用同一个 SDK 进行开发,使用共同的后台服务、前端接口、计费排查工具,能降低运营难度和使用成本。


像语聊房之所以能被各企业快速的搭建起来,技术的推动是一个重要的因素,以融云融合 IM 和音视频的语聊房 SDK 为例,开发者利用这样一套 SDK,可以在 30 分钟内快速集成语聊房场景能力。


对于如何在行业领域里建立技术壁垒,杨攀认为其中一个关键在于:“能够跟上整个时代发展潮流,快速的响应,为客户提供最佳的解决方案。”


5G 的发展给基础设施带来了低延迟、高带宽、高并发性能上的提升,那么从技术上,我们就可以处理更高分辨率的视频,得到更好的音质,而这些方面对音视频编解码提出了更高的要求。伴随 5G 的场景变化,给整个产业也带来了非常大的变化,原来因为成本的问题没法做的,现在都可以进行海量应用了。


比如说 5G 技术给 VR 和云游戏提供了很好的网络基础设施,VR 传输的视频信息量是传统的视频体系量的若干倍,而云游戏也不再需要下载很大的游戏包到本地,现在依靠音视频实时通信的技术,把远端的服务器上的运行的游戏画面实时传回到用户侧,再通过用户操作实时通过信令的方式传回到引擎,可以实现在线玩游戏。这就需要适应整个技术趋势,在通信承载能力上,包括视频、音频质量处理的能力,去做持续的改进。同时也要适应客户的终端上的改变,从显示屏和手机屏幕,再到以后的 AR、VR、XR 终端。


另一方面,人工智能也对音视频有很多优化。现在音视频优化算法都或多或少引入了一些人工智能降噪技术来提高音频、视频质量。另外一方面是基于人工智能的一些具体的业务场景需求,比如说虚拟人像、虚拟声音的合成处理、实时美颜、实时美声,融云需要对应地提供这些功能的插件,需要在 SDK 和服务端这一侧开放足够多的接口 API,支持这样的一些服务。而且还需要为未来每个可能出现的场景,给开发者推出针对性的 SDK。


杨攀表示:“在遵循业内标准的前提下,我们所有的技术都是完全由自己核心掌握的,相关的代码都是自融云创立以后重新正向开发的,所以面对客户的最新的需求的时候,我们往往可以第一时间给客户提供具体的解决方案,或者根据客户的需求快速迭代出新的产品功能、开发支持,甚至可以做到以周为单位给客户提供新的功能。保持快速迭代的同时,通过这些年的积累,各种接口成为了业界最全的,接口数量在业内也是遥遥领先的。这些都是开发者服务厂商的核心竞争力。”


技术与服务并重


目前融云的这套集“IM 即时通讯+RTC 实时音视频+PUSH 推送”于一体的解决方案已经迭代到了第五代,早期通过一些输入验证了核心技术点,后边几次迭代逐步提升通信服务质量,以及对开发者的接口友好度,让开发者能够以更低的成本、更快速集成和使用这些 SDK。


提供稳定安全的服务最基础的体现是在整个产品服务的运维体系和开发的流程方面。线上产品在运维的过程中,是否有足够多的监控,发布流程、升级过程是否足够的科学稳定,本身架构的设计是否足够的健壮,这些都是用来保障安全稳定服务的基础。


另外一方面,在整个的产品的周期范围内,通过一定的机制能第一时间发现并快速解决问题,这也是一个非常重要的能力。杨攀讲道:“真正的 2B 的业务包括两个方面,一是有没有技术实力能解决客户的问题。二是对客户本身的业务是否有足够的理解。我们需要在开发者发现问题之前,把出现的问题解决掉。”


稳定可靠的技术优势,赢回来的就是口碑。客户用了产品,体验好的话必定会再推荐给别人。


在开发者服务这个领域,口碑远远比市场的品牌营销、市场的宣传更重要。因为开发者都是非常理性的群体,他们使用之前往往都会问一下身边的人。杨攀解释说,融云这些年来不断的扩展,在市场宣传方面投入的经费,可以说是远远低于其他的厂商,客户数、市场占有率的提高,都是口碑传播的效果。


中国的开发者服务产业,还属于早期阶段。市场竞争会越来越激烈,人力成本也越来越高,人力成本的提高,最大的促进因素在 2B 行业,也就是帮别人解决问题的需求会越来越多,因为帮别人解决问题是在降低他的成本。越是竞争激烈的行业越需要去优化自己的成本结构,提高自己的效率,也就越需要找更低成本的第三方来替代自己的工作,杨攀认为开发者服务行业迟早会迎来爆发阶段。


融云从 2014 年开始就进入这个领域,可以算是开发者服务领域里面比较早期的厂商,多年来积累了开发者服务行业的各种经验和案例。在 WICC 2021 大会,杨攀将为开发者分享融云关于开发者服务生态的思考,围绕国内开发者服务产业现状、开发者需求分析、融云开发者服务体系建设等多方面展开。同时,也会和其他几位重磅嘉宾一起以“开发者生态”为主题进行高峰对话。


本次大会主要聚焦通信云领域的尖端技术,尤其是音视频领域的新技术与应用,分享在线教育、社交泛娱乐等多行业的最佳实践思考,主要价值在于更广泛地开拓开发者视野和更好地服务开发者生态。会议设有三个分论坛:“网络传输和系统架构”、“RTC 新技术与应用”、“场景化赋能与创新” 。除了分论坛的众多业界技术大咖之外,还请来了清华大学计算机科学与技术系的长聘教授孙立峰,他将带来《互联网音视频服务:从 AI 赋能到智慧内生》的主题演讲;以及北京大学的副教授张行功博士,他将带来《虚拟现实视频的应用和技术》的内容分享。了解详情:https://wicc.rongcloud.cn/2021/index?track=infoq2



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-07-06 17:252305

评论

发布
暂无评论
发现更多内容

2021年五面蚂蚁,从单体到分布式,必须解决的四个问题

策划Java工程师

Java 程序员 后端

基于 Apache APISIX,新浪微博API网关的定制化开发之路

API7.ai 技术团队

Apache 网关 APISIX 微博

双非本化学跨专业,投岗阿里/滴滴后端三面,最终拿下offer

编程菌

Java 编程 程序员 面试 计算机

从河南暴雨、疫情反弹看区块链“灾疫”治理

CECBC

gitlab无法通过ssh拉代码

阿呆

#GitLab

Linux 网络管理技术 OSI 七层模型和 TCP/IP 四层模型

学神来啦

Linux 运维 IP

Hologres揭秘:深度解析高效率分布式查询引擎

阿里云大数据AI技术

频繁出现的分布式拒绝服务 (DDoS) 攻击​,有什么办法可以抵御吗?

九河云安全

面试官:你了解JVM的锁优化吗?

百度开发者中心

Java 最佳实践 方法论 语言 & 开发

2021Java春招面试真题详解,Git-如何优雅地回退代码

策划Java工程师

Java 程序员 后端

2021Java笔试题总结!Java个人学习之旅(第十天)

策划Java工程师

Java 程序员 后端

2021最新Java面试真题解析!1

策划Java工程师

Java 程序员 后端

啃书一年多的我,推荐Python初学者不要在乱看书了,有这三本就妥妥的

冇先生

FastApi-04-请求体-1

Python研究所

FastApi 8月日更

当企业遭遇分布式拒绝服务 (DDoS) 攻击时,第一时间该如何进行操作?

九河云安全

区块链技术如何有效应对气候变化

CECBC

Python代码阅读(第2篇):数字转化成列表

Felix

Python 编程 Code Programing 阅读代码

2021Java面经:Android屏幕适配-重点盘点

策划Java工程师

Java 程序员 后端

2021年Java知识体系总结,部门老大:redis-分布式锁再这么用

策划Java工程师

Java 程序员 后端

你使用的SimpleDateFormat类还安全吗?

华为云开发者联盟

Java 安全 线程 高并发 SimpleDateFormat类

编译脚本:编写CMakeFile(一)

正向成长

CMakeFile

下一个颠覆的领域:区块链如何影响审计行业?(下)

CECBC

2021Java大厂面试集合,java多线程

策划Java工程师

Java 程序员 后端

FIL分币系统源码|分销商城功能开发模式介绍

Geek_23f0c3

fil Fil算力挖矿分币系统 Filecoin分销商城

DataPipeline荣膺CFS第十届财经峰会“2021数字化转型推动力奖”

DataPipeline数见科技

大数据 数据融合 数据管理

TRTC代码示例文档集合完毕!哪里不会点哪里!

腾讯云音视频

腾讯云 音视频 API sdk

【最不佳实践】Serverless应用优化四则

刘宇

Serverless 优化

关于Spring注解开发教程,打包全送你

华为云开发者联盟

Java spring 容器 注解 组件

ironSource 在 2021 ChinaJoy 举办多场活动赋能中国开发者

防火墙 Keepalived 异常双活恢复后部分外网访问中断问题分析

Qunar技术沙龙

运维 防火墙 网络 故障诊断 keep-alive

2021年Java开发实战!仿微信的网络聊天室项目开发【完整源码讲解

策划Java工程师

Java 程序员 后端

专访融云杨攀:音视频技术的下半场,在于开发者服务生态_语言 & 开发_Tina_InfoQ精选文章