全栈算力,加速行业AI落地 了解详情
写点什么

2021 全球互联网通信云大会(WICC)亮点回顾:AI 赋能音视频,开发者生态服务将驱动行业未来发展

  • 2021-08-05
  • 本文字数:4332 字

    阅读完需:约 14 分钟

2021全球互联网通信云大会(WICC)亮点回顾:AI赋能音视频,开发者生态服务将驱动行业未来发展

7 月 24 日,由极客邦和融云联合举办的第三届全球互联网通信云大会(WICC 2021)在北京召开。上千位开发者相聚在大会现场,演讲场场爆满,还有近万人通过网络直播的形式,共同参与到这场大会中。

 

近一两年来,音视频行业得到了极大的发展,音视频技术已成为互联网信息服务的基础设施。无论是开发者还是普通用户,都能清楚地看到,视频已成为新的、重要的交互途径。视频直播和 WebRTC 的应用让我们能够更快地适应瞬息万变的世界,实时视频应用和远程呈现的重要性得到了进一步的提升。

 

融云每年都会举办全球互联网通信云大会(WICC),希望通过 WICC ,向行业普及前沿技术,以及各种应用实践案例,推动通信云行业的发展。

 

本次大会设置了上午的高峰论坛和下午三场技术分论坛,亮点主要集中在三个方面:第一,为促进产学研用的深度融合,构建了成效显著的交流互动平台;第二,为更好地建设开发者服务生态,提供了有益的解决方案;第三,分享音视频技术在在线教育、社交泛娱乐等多个垂直场景的最佳实践和思考,为开发者带来了新技术和新视野。

 

产学研用深度融合

 

在主论坛上,来自清华大学计算机科学与技术系的长聘教授孙立峰为大会带来了《互联网音视频服务:从 AI 赋能到智慧内生》的主题演讲。

 


孙教授的演讲,从产学研合作角度分享了 AI+音视频里面的思考和所做的一些工作,主要围绕:为什么互联网音视频的挑战让我们引入 AI,AI 如何让音视频性能得到提升,以及该领域未来有哪些演进途径等。

 

上图这些数据传达出来的信息,大家可以看到:音视频已经是互联网上主导的流量;音视频服务正在改变我们的生活和工作,以及产生新的产业格局和形态。互联网的音视频服务已经逐渐成为互联网基础服务设施。音视频变得重要,促进了业界和学界不断进行技术的创新,从而带动产业的提升和创新。

 


云-边-端协同已经成为大规模互联网音视频的基础架构,共同提供了音视频服务所需的存储、计算和网络资源。现在动辄数十万量级服务器资源部署、千万级的每日上传内容数量、亿级的用户终端数量,这种大规模带来的是整个系统的复杂性急剧增加。

 

在这种情况下,关注系统的动态性显得更为重要:比如 CDN 的服务质量、对云上资源的利用率、端到端的网络状态,这些动态性难以保证音视频服务的质量。用户行为的动态性决定音视频流的传输流向和资源需求,例如当有大主播上线,会导致对系统资源的需求发生急剧变化。而底层网络缺乏对视频类型、画面内容、用户主观质量的感知,难以满足用户对服务质量的要求。

 

所以,互联网音视频服务的挑战,我们可以总结为大规模复杂系统的决策问题。在云端,我们要决定视频转码和调度;在边侧,我们要决定部署哪些流行度高的内容,用户接入到哪个边缘节点来保障质量;在端侧,根据网络变化选择什么码率、拥塞控制策略。

 

目前的感知和决策,靠的是一些简单的、不精确的模型上得到的一些规则,很难达到优化的目标。所以,清华大学将 AI 的方法引入到了音视频服务领域,来提供更好的体验。他们将深度学习和(深度)强化学习使用到了音视频领域的感知智能和决策智能中,极大地减少了云厂商视频分发的接入成本和回源成本,提高了视频链路的利用率,同时还能满足不延迟、不卡顿的要求。

 

清华大学利用 CNN+LSTM 的深度神经网络,使用边缘节点的输入参数,时序预测边缘节点的 QoS 变化,选择汇聚节点,同时预测直播间的流行度,进行实时调度。这套方法部署到了华为的边缘云上,回源成本减少 30%以上,且无卡顿恶化。由于视频画面内容的不同,码率的提升对视频主观质量的增强有显著的差异,所以我们需要传输更高质量的视频而非更高码率。清华利用深度神经网络基于视频历史画面预测未来视频主观质量,在实时视频通信场景下,能将视频质量提升 18%-25%;在 CDN 调度方面,基于深度强化学习的方法能将 QoE 提升 5%,且同时将成本降低 24%......

 

目前上述多种基于深度学习和深度强化学习的视频传输优化算法已经在 GitHub 上开源。

 


除孙立峰教授外,大会还邀请了北京大学副教授张行功博士,天津大学智能与计算学部教授王晓飞,中国科学院声学研究所研究员、博士生导师李晓东等,这几位教授立足于各自领域的尖端学术成就,为大会分别带来了《16K 沉浸式视频技术》、《5G 时代的边缘智能与云边协同》和《通信声学新进展》的技术分享,这些技术实现将为 5G 下通信云的产业发展释放无限潜能,让未来的通信场景变得无处不在。

 

建设开发者服务生态

 

近年来,开发者服务生态建设的热度持续上升。在开发者服务生态方面,融云联合创始人兼 CTO 杨攀在高峰论坛上发表了《以通信为核心的开发者服务生态探索》的主题演讲,围绕着开发者需要什么样的服务和业务,分享了融云关于开发者服务生态的思考。

 

融云于 2014 年成立,开创了通信云服务,是一个全新的服务品类。从 IM 如何实现不丢消息,到弱网下如何提高音视频质量,再到音视频服务如何实现全球覆盖……在这个过程中,融云的思考不断迭代升级。杨攀指出:中国的开发者服务产业尚处于早期阶段,随着市场竞争的日趋激烈,人力成本将持续走高,企业要想优化成本结构,提升效率,就需要寻求与第三方 to B 厂商合作来进行工作替代,因此,开发者服务行业迟早会迎来爆发阶段。

 


在演讲中,杨攀分享了构建开发者服务生态的一些经验。

 

现在中国移动互联网业务席卷全球,杨攀认为,出海业务经历这么多年的发展,除了解决技术这一基础问题之外,还有相当多的其它问题需要开发者去考虑,其中就包括文化和法律法规。合规涉及的细节非常之多。在个人隐私方面国内出台了《信息安全技术 个人信息安全规范》,国外的法规有 GDPR、CCPA、HIPAA 等。

 

做全球业务的时候,开发者一定要注意 App 是否有违背相关法规的行为,或者 App 集成的第三方 SDK 是否有收集用户隐私。在国内可能因触犯用户隐私法规而受到相关处罚;在国外还有可能会被罚到“倾家荡产”,导致公司直接关闭。所以,在全球化过程中,通信云厂商应提醒开发者时刻保持内容合规与安全的意识,避免因触碰“红线”让企业遭受难以承受的损失。

 

合规化方面,概括起来包括个人隐私、数据安全、数据主权、内容安全和通信安全等。除了关注各种隐私、安全法规外,融云还为开发者在文档里提供了现成的说明参考模板。在内容安全上,融云的系统满足了内容审核多样性、多语言支持、多种审核模式的要求,而且还针对不同业务类型提供了不同的审核模型。另外,融云还以登陆凭证认证、链路安全、平台安全管理等措施,保障用户通信安全。

 

在应对开发者的全栈化需求方面,平台需要支持的技术栈越来越多:Flutter、React Native、Unity、uni-app、H5、Electron、Mini Program、Windows、Linux。不同的技术栈服务的是不同的业务场景,而这些不同的技术栈,还得考虑不同平台、不同版本的兼容性问题,厂商需要做不同的交叉验证。杨攀介绍道:“你在用一个开箱即用的业务的时候,实际上背后有非常多隐藏的细节,被融云这样的厂商所封装起来。”

 

从服务开发者实践角度来看,也有几个趋势值得注意。

 

一是要提供场景化能力,就是将业务逻辑抽象出来,封装出这一场景的最佳实践供用户使用。演讲中,杨攀以语聊房场景举例,使用融云封装的 SDK,只需 30 分钟就可以完成功能的集成。

 

二是要提供模块化能力,开发者在开发一个 App 的过程中,有时甚至需要集成二十几个 SDK,比如 IM 里的红包、表情、地图、语音转文字、翻译等,音视频中的美颜、美声、白板模块等,而这些原来都需要开发者自己去找第三方厂商沟通、付费。融云将这些专业、垂直领域厂商的功能与自身的通信能力对接,以模块化的形式提供,开发者无需再去对接多个供应商,从而能进一步地提升开发效率。

 

三是要提供集成化能力。集成化能力实际也是帮开发者降低开发成本,同样是产业发展的一个大趋势。以整合 Android 推送整合为例,原来开发者需要自己整合华为 HMS、小米、魅族、OPPO、vivo、FCM 等各种推送平台来保证推送到达率,但现在融云帮助开发者对接好了所有厂商,开发者可以直接使用这个集成好的功能。

 

在开发者服务生态建设方面,大会专门以《开发者生态》为主题展开了高峰对话,“对话”由蒋涛老师主持,由融云联合创始人兼 CTO 杨攀、DCloud CTO 崔红保、以及支流科技联合创始人温铭三位业界顶级大咖出任对话嘉宾。

 

 

“对话”围绕中国开发者生态演变进程的回顾与展望,通过三位 Top 级开发者嘉宾对于自己开发历程的分享和互动,在开发者如何驱动行业创新方面贡献了真知灼见。其中,最为一致的观点是:新技术背后的高水平开发者供不应求,中国开发者需要创新生态建设。开发者要不断跟随技术崛起的脚步,多渠道获取进阶技能。“对话”带来的全新思考和借鉴经验,将有益于打造技术与开发者生态对接的平台,进而推动产业应用的发展。

 

行业最佳实践和思考

 

在服务开发者的具体实践方面,本次大会围绕音视频技术及其场景化的解决方案,设立了三场技术分论坛,即:“网络传输与系统架构”、“RTC 新技术与应用”以及“场景化赋能与创新”。讲师们从不同技术领域、不同维度和不同场景带来了自有核心技术和最佳实践的分享。

 

在“网络传输与系统架构”中,支流科技联合创始人温铭的《Apache APISIX:如何做到七层网络流量的统一技术方案》,融云首席架构师李淼的《融云构建全球一体化网络的设计解析》,Akamai 中国区资深技术顾问程希的《全球 API 加速网络构建》,Telstra 资深解决方案顾问徐艳涛的《SDN 全球一体化人工智能网络——为您的实时数据传输保驾护航》,大家分享了如何实现高可靠、高质量、高并发和低延迟的音视频通信体验。

 

在“RTC 新技术与应用”中,除了中国科学院声学研究所研究员李晓东、北京大学副教授张行功博士的演讲分享外,亮亮视野产品负责人张昊阳分享了 RTC 技术在 AR 智能可穿戴设备行业的落地应用;商汤科技技术总监赵代平介绍了 AI 图像分割技术及种类,还带来了许多 AI 产品的展示;融云视频算法专家黄震坤则带来了基于人工智能的 ROI 视频编码的技术分享,重点介绍了在弱网环境下用人工智能中的目标检测和背景建模对视频压缩进行优化的方案。

 

在“场景化赋能与创新”中,荔枝高级音频工程师马朋飞、融云高级架构师臧其龙、好未来直播中台产品负责人冯权成、获得场景视频商业产品总经理任哲、依图科技语音架构师王芳,分别通过直播场景下高音质优化、语聊房场景化 SDK 设计、实时音视频在教育场景的应用实践、面向企业及教育机构的高质量音视频通信以及语音技术在内容安全方面的实践与趋势,分享了核心技术和最佳实践。

 

结语

 

2021 WICC 全球互联网通信云大会已圆满落幕。大会上的演讲场场精彩,为行业实践提供了切实可行的解决方案,同时也指引了未来技术方向和发展趋势。讲师们精辟入理的讲解获得了开发者的高度认可,我们提供了回看合集,可以让大家重温演讲内容:

 


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-08-05 10:232883

评论

发布
暂无评论
发现更多内容

数字经济跨越五个融合发展阶段,区块链正成为基础支撑结构

CECBC

数字经济

谷燕西:不需要银行的银行业务

CECBC

移动互联网

Newbe.ObjectVisitor 0.4.4 发布,模型验证器上线

newbe36524

.net core ASP.NET Core dotnet

S型曲线不止关乎身材?|技术人应知的创新思维模型(2)

Alan

创新 思维模型

面试被问线程安全怎么保障,我的回答让面试官眼前一亮

996小迁

Java 架构 面试 多线程

第六周-学习总结

Mr_No爱学习

构师训练营 - 第七周课后练习

joshuamai

拆解增长黑客之实战(二):留存与变现

懒杨杨

读书 增长 产品运营

Bitmap为什么那么快?

Man

redis 中间件

报销发票抵扣工资的CTO,该不该? | 法庭上的CTO(5)

赵新龙

CTO 法庭上的CTO

第十一周作业

solike

构师训练营 - 第七周学习总结

joshuamai

甲方日常 64

句子

工作 随笔杂谈 日常

第六周-作业1

Mr_No爱学习

基于有限状态机与消息队列的三方支付系统补单实践

Java架构师迁哥

百篇已过,又是一个新篇章,谈谈感受吧

良知犹存

代码人生

Spock单元测试框架实战指南四 - 异常测试

Java老k

Java 单元测试 spock

云原生架构:容器资源限制及资源可见性

云原生实验室

云原生

告别“效率内卷化”,华为用一年时间让职场人支棱起来

脑极体

国家计算机网络与信息安全管理中心官员:数字货币的风险仍需关注

CECBC

信息安全

《Python深度学习》第二版重磅来袭——(Keras之父亲自编写)

计算机与AI

Redis 子进程开销监控和优化方式

码农架构

Redis开发与运维

架构词典:语言

lidaobing

架构 语言

前端开发还可以这么玩?元数据实践分享

华为云开发者联盟

大前端 元数据 组件 ROMA 业务流

Windows下MySQL无法启动万能解决方案

MySQL从删库到跑路

MySQL

算法训练营课程纲要

陈皓07

警察营救安徽望江县17岁女生跳河自尽过程中,现场看热闹的旁观者们在做什么?

wbliu85

mongodb 源码实现系列 - command 命令处理模块源码实现二

杨亚洲(专注MongoDB及高性能中间件)

MySQL mongodb 分布式数据库 源码刨析 分布式数据库mongodb

2. Spring早期类型转换,基于PropertyEditor实现

YourBatman

Spring Framework 类型转换 PropertyEditor

Redis 持久化方式-RDB

码农架构

redis redis持久化

生产环境压测建设历程之三 淘宝网2009年的痛

数列科技杨德华

2021全球互联网通信云大会(WICC)亮点回顾:AI赋能音视频,开发者生态服务将驱动行业未来发展_AI&大模型_Tina_InfoQ精选文章