限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

RTC+AI+5G,这届 RTC 大会有点意思

  • 2019-11-11
  • 本文字数:3125 字

    阅读完需:约 10 分钟

RTC+AI+5G,这届 RTC 大会有点意思


这是一条时光长廊,通向 RTC 大会的现场。


在 10 月 24、25 日两天,3000 人次走过这条时光长廊,聆听了来自声网、W3C、搜狗、微软、阿里达摩院、字节跳动、Hulu、优酷、沪江 CCTalk、bilibili、数美科技、相芯科技、声网 Agora、Meetecho、AVS、北京大学、上海交大等公司、高校、组织机构的 100 余名技术领袖、音视频技术大咖、产品创新专家的精彩分享。



不得不说,无论是从议题设置、大咖邀请、场景布置、游戏暖场等环节里,都看出了这届 RTC 的“小心思”。


嗯!这届 RTC 有点意思!

亮点之一:峰会大咖云集,RTC 前沿趋势尽览

在 10 月 24 日上午的峰会上,由声网创始人兼 CEO 赵斌发表开场演讲。 “实时互联网是互联网企业必需的工具和功能。我们希望通过这样的大会让开发者使用实时音视频功能像使用水一样简单。”这是赵斌在接受媒体采访时描述的 RTC 大会在他心目中的定位。



声网创始人兼 CEO 赵斌


今年是 RTC 大会的第五年,整个会场里谈论 AI 和 5G 的参会者特别多。正如赵斌在演讲中介绍的:“我们看到 AI 在实时音视频里更广泛的应用,无论是 AI 降噪还是回声消除,甚至在网络带宽预测等方向上,都有着巨大的和普遍的使用场景,这是 AI 在实时音视频方面使用能力的觉醒,我们也开始加深在这方面的探讨。”


小编解读:从目前 AI 与 RTC 的应用来看,其主要结合点有:语音分析、语音机器人、计算机视觉、RTC 优化。声网近年来一直在积极推进教育、社交、游戏、IoT、医疗等行业的合作,并在不同行业应用中提供了 100 多个场景化解决方案,这个数量还在持续增加。


在教育行业的在线教育场景中,老师与学生互动效果关联着教学质量。因此,声网推出了支撑高清、稳定、高并发的互动音视频解决方案,并与 AirCourse 爱课、作业盒子等教育企业先后推出了“超级小班课“模式。一方面,老师大班直播授课时流畅、稳定;另一方面,到互动环节时,可无缝衔接小班助教,确保学生的被关注度与互动效果。


在 IoT 领域,声网则关注了智能硬件设备进行互动操作时,对于低功耗、稳定性的要求,推出智能硬件专用的低功耗 SDK,并集成于小天才手表、小米音响、亮亮视野等智能设备。赵斌认为,实时音视频是一种通用能力,而作为服务商,需要持续推动能力与具体场景碰撞,并通过技术上的改进与迭代实现与场景的深度融合。


声网首席科学家钟声分享了“实时视频技术的现状与未来”。在会后的采访中,他也提到:“去年 RTC 大会我也参加了,当时也做了一个报告,列出了几大挑战。今年当我重新审视一下去年的挑战以及这一年来声网做出的努力。从效果来说,在音视频领域不卡不糊不延时这方面,又取得了非常多的进步。随着人工智能时代的来临,再加上 5G 的兴起,那么 RTC+AI+5G 会是什么样?未来又会面临一些什么样的问题?这是我们一直在思考,并时刻做好准备去解决的问题。”



声网首席科学家钟声


在 AI 与 RTC 技术的融合方面,声网也正进行探索,视频“超分辨率”——通过深度学习来提高其分辨率,进而改善实时视频图像质量的技术就是其中之一。超分辨率主要应用于将传输过程中,因带宽及性能限制导致的低码率视频质量复原并提升分辨率。“声网已经解决了超分辨率应用中既要细节生成效果好、又要深度学习算法模型足够小,能在移动端设备上支持实时应用、还能抑制一定的编码失真噪声等技术难题。”


小编解读:超分辨率是计算机视觉里比较底层的一个问题,可以理解为将低分辨率、低清晰度的东西变成高分辨率、高清晰度的东西。现在超分辨率技术得益于深度学习的算法,尤其近几年生成对抗网络的兴起,能够根据内容假想出一些东西来。比如说一片草坪,有可能生成一些草尖出来,但其实本来的没有的。这些假的细节是符合人的视觉感受的。这就是现在超分辨率技术利用人工智能算法的主要场景。钟声提到,“我们在这方面也做了一些工作,我知道有一些公司或者是友商也在做类似的技术,目前是在云端或者在服务器端实现的,比如离线的处理等。但是对于声网而言,我们要做的是实时处理,相对而言挑战更高一点。”


同时,针对 RTC 行业内服务质量无法有效量化的问题,声网发布了“水晶球”产品,将其 RTC PaaS 服务的各项运行质量指标可视化展现给客户。声网提供 QoE、QoS 实时数据统计、用量及区域分布分析,问题调查工具及质量监控报警服务,帮助客户和开发者能够及时、快速判断声网实时 RTC 服务的业务运行状态和质量效果。

亮点之二:分论坛聚焦行业痛点,解读技术实战经验

本次大会上发布了多项最新研究成果,包括声网 Agora 技术 VP 高泽华宣布声网将开源抗丢包音频编解码器 SOLO,该编解码器兼容 WebRTC,可让实时音频交互获得更高质量的音质、更低的延时。



声网 Agora 技术 VP 高泽华


InfoQ 小编在之前采访高泽华的时候,也问到了他关于 RTC 未来发展的看法,他提到,“RTC 其实还处于高速发展中,在我看来,任何一个技术点都是值得深挖的。我举一个最简单的例子,虽然我们现在已经有 4 个摄像头了,但是我还是觉得拍的照片跟我人眼看到的不一样。技术的发展还有很大的空间,而这其中每一个环节都是一个挑战。”


除了声网的技术专家带来的分享之外,本届大会论坛内容还涵盖 RTC 技术与新一代信息技术结合的发展研究,如实时视频、实时音频、实时传输、视频内容检索与推荐、实时交互等层面与 AI 结合的落地应用;5G 对 RTC 技术的革新及面临的问题;基于多种实时识别和动态捕捉的能力;人机的实时交互将走向何处等内容。来自 W3C、微软小冰、优酷、相芯科技、声网、北京邮电大学等公司的技术大牛,从 5G、实时感官系统、智能图形技术、6DoF、实时传输技术等角度带领开发者们一起拓宽技术认知,看到下一代 RTC 技术的新趋势。


以优酷高级算法专家盛骁杰的分享为例,5G、8K 时代的加速到来,将极大地缓解视频传输带宽和终端解码能力的约束。而 6DoF 视频则在 360 度 VR 视频的基础上更进一步,将传统平面视频在分辨率维度的清晰度提升转化为高自由度的空间信息量的提升,并通过可交互式视频体验突破移动端显示分辨率对 5G 时代视频体验的约束,提供了更多的想象空间。正如盛骁杰在演讲结束时提到的:“5G、8K 和 AI ,包括异构计算能力的提升,未来将极大地改善 6DoF 视频在各个业务方面的瓶颈,使得用户的体验能够越来越好。”



优酷高级算法专家 盛骁杰

亮点之三:精心的布置,充满趣味的 Workshop,让参会者体验升级

每年的 RTC 大会上都有一个「保留节目」,就是 Workshop。不同于黑客马拉松,Workshop 更像是一个技术新手的线下集训营,通过几个小时的集训,帮助想要学开发的小白能够快速实现从 0 到 1,完成简单的开发任务。


自 2015 年开始以来,WebRTC 标准之父、IETF 的参与者 Daniel C. Burnett 都亲自作为培训导师;分享的主题也紧贴开发需求,例如:WebRTC API 的应用、SRTP 在内的媒体协议、DTLS 及隐私保护、媒体流和音视频轨道新功能介绍、WebRTC 底层 API 接口介绍、WebRTC 的新发展……正因如此,每年的 Workshop 环节都让开发者格外兴奋,100 人的场子场场爆满。


而今年 RTC 大会的 Workshop 环节当然也没有让大家失望,来自 Janus 开源项目的作者 Lorenzo Miniero 、前新东方集团音频技术专家李超和声网 Agora 的音频算法工程师赵晓涵带来了 4 个主题的分享,包括:


  1. WebRTC 1 对 1 实现 / 服务端技术选型 / 多对多服务端原理;

  2. Janus 服务端实践;

  3. WebRTC 网络抗丢包策略;

  4. WebRTC 降噪与回声消除


正如李超老师在 RTC 大会之后发的朋友圈一样,这次大会每一位讲师都全身心的投入,要为开发者提供最好的技术干货。



RTC 现场还举行了 1024 程序员节 Party,有现场调酒师、美女打碟,还有桌上足球、街机、大力锤等丰富多样的游戏。瞧,程序员们玩得多开心~





是不是还意犹未尽?对于明天的 RTC 大会,你还有哪些期待,欢迎留言告诉我们!声网 RTC 大会 2020,明年见!


2019-11-11 11:441553
用户头像

发布了 124 篇内容, 共 48.0 次阅读, 收获喜欢 177 次。

关注

评论

发布
暂无评论
发现更多内容

给面试加点硬菜:延迟任务场景,该如何提高吞吐量和时效性!

小傅哥

小傅哥 架构设计 Redis 6.0 任务系统

虎啸春来!丰树电子与中联重科签署战略合作协议

联营汇聚

甜言蜜语生成器、定时问候邮件机…开源程序员为这个情人节付出太多

腾源会

开源

Spring Boot Serverless 实战系列 | 性能调优

阿里巴巴云原生

阿里云 Serverless 架构 云原生

SSH远程连接命令执行没反应不报错问题解决(-bash: fork: retry: Resource temporarily unavailable.[资源暂时不可用])

山河已无恙

SSH Linxu 2月月更

人人都是 Serverless 架构师 | 现代化 Web 应用开发实战

阿里巴巴云原生

阿里云 Serverless 云原生

《MySQL入门很轻松》第4章:数据表中能存放的数据类型

乌龟哥哥

数据库 2月月更

剑指Offer——企业级项目中分层的含义与依据及多态的优势

No Silver Bullet

封装 offer 继承 多态 2月月更

为什么start方法不能重复调用?而run方法却可以?

王磊

Java 面试

http请求中的payload

喀拉峻

网络安全

企业为什么要做应用多活?

阿里巴巴云原生

阿里云 云原生 容灾

Go 语言Web开发很简单:使用模板将视图与逻辑分离

宇宙之一粟

Go 语言 Web应用开发 2月月更

计算机网络面试知识点

yuexin_tech

面试 计算机网络

Kotlin语法手册(三)

寻找生命中的美好

android kotlin 安卓

DGIOT 工业物联网开源平台简介

dgiot

物联网 2月月更 2月日更 dgiot dgiot物联网

微信朋友圈高性能架构方案

Geek_36cc7c

DevOps进阶(三)走近 DevOps 工程师

No Silver Bullet

DevOps 敏捷 jenkins 2月月更

平安保险基于 SPI 机制的 RocketMQ 定制化应用

阿里巴巴云原生

阿里云 云原生 消息队列 开源云工具

详细讲解mybatis的执行流程

编程江湖

mybatis

KubeDL HostNetwork:加速分布式训练通信效率

阿里巴巴云原生

阿里云 云原生 分布式训练 KubeDL

阿里云容器服务差异化 SLO 混部技术实践

阿里巴巴云原生

阿里云 Kubernetes 云原生 混部技术

如何快速构建服务发现的高可用能力

阿里巴巴云原生

阿里云 开源 微服务 云原生

独家下载!阿里云云原生携 10+ 技术专家带来《云原生与云未来的新可能》

阿里巴巴云原生

阿里云 Kubernetes 云原生 电子书

云原生落地大爆发,企业和开发者如何把握先机?

阿里巴巴云原生

阿里云 云原生 ACK ACK Anywhere

Spring Boot Serverless 实战 | Serverless 应用的监控与调试

阿里巴巴云原生

阿里云 Serverless 云原生

国内唯一!阿里云容器服务进入 Forrester 领导者象限

阿里巴巴云原生

阿里云 云原生 容器平台

【附赠PPT】 KubeMeet 成都站回顾:让云原生应用交付和管理变得更简单!

阿里巴巴云原生

阿里云 Kubernetes 云原生 活动 开源项目

运营给产品送的情人节礼物是?

阿里云弹性计算

产品运营 情人节 轻量征文 用户投稿

Linux系统编程-进程间通信(mmap内存映射)

DS小龙哥

2月月更 mmap内存映射

专访 OpenKruise 负责人:现在的云原生应用自动化发展到什么程度了?

阿里巴巴云原生

阿里云 开源 云原生

流量录制与回放在vivo的落地实践

vivo互联网技术

测试工具 回归测试 流量回放

RTC+AI+5G,这届 RTC 大会有点意思_GMTC_关贺宇_InfoQ精选文章