关于 WebRTC: 挑战与机遇并存的实时通信

阅读数:2747 2013 年 6 月 17 日

话题:语言 & 开发架构

QCon New York 2013大会上, Gustavo Garcia 就支持 HTML 5 的新型实时通信组件 WebRTC 做了主题演讲。WebRTC 是一系列技术的组合,能在端到端之间实现实时、低延时的通信,可以用于视频和音频会议以及游戏。虽然通常都使用 WebSockets 来实现实时通信,但 WebRTC 却尝试通过直接在端到端之间建立连接来显著地降低延迟,并且只有在出现例如 NAT 或防火墙等原因导致不能直接建立连接的情况下,才会使用 NAT 穿透技术 。

Garcia 描述了构建一个视频或音频会议系统所需要的各种组件。建立一个一对一的通话也许是最简单的情景。这就需要浏览器中支持如下特性:

  1. 支持对流式视频和音频的解码和显示
  2. 能够从网络摄像头中捕获视频和音频流
  3. 对呼叫的协调协议(如信号处理)
  4. 高效的音频和视频的编码及解码器
  5. 处理回波消除、噪声抑制、比特率适应(根据带宽自适应的流)等诸多方面的算法。

其中有许多是现在 HTML5 的一部分,包括流式视频和音频,以及通过getUserMedia去捕获视频和音频。虽然可以使用 getUserMedia API 去捕获音频和视频,但也只是实验性的扩展,在目前新构建的 Chrome 版本中实现了去捕获屏幕、单独的浏览器 tab 或部分网页的功能。

WebRTC 忽略了重要的一点是对信号处理(signaling)的直接支持。信号处理用于控制呼叫的建立:谁在尝试呼叫谁,是否有人接受这次呼叫。信号处理必须由开发者自己实现,例如使用 WebSockets 或 HTTP 长轮询。开发者必须部署的另外一块基础设施是隧道服务器,它在用户需要 NAT 穿透和使用受限防火墙时充当中介角色。据 Garcia 估计,大概 8%的呼叫都需要这样的中间隧道服务器。

Garcia 描述了 WebRTC 的各种使用场景:

  • 一对一的视频和音频通话使用 WebRTC 来实现是最简单的。
  • 多方通话较难实现。一种方法是在完整的网状网络中,每个参与者都连接到所有其他参与者,但由于 CPU 占用率过高和带宽的限制,这种方法不能供超过 5-6 人使用。另一种方法是使用一个中间服务器,聚集所有的流,以单独或是合并成单一流的方式将其广播到所有其他参与者。
  • 允许 WebRTC 连接到固定电话网络,并通过网络浏览器拨打固话。
  • 结合其他技术如 HTML5 WebGL 实现实时的多人游戏
  • 因为 WebRTC 支持端到端之间任意数据的传输, 因此该技术可以用来在用户之间传输文件。例如,可以想象以这种方式建立类似 BitTorrent 的应用。

尽管当今支持 WebRTC 的浏览器(目前只有较新版本的 Chrome 和 Firefox 支持)还不是很多,但已经有了许多应用的例子。要了解有关该技术的更多信息,请参考webrtc.org或相关W3C 标准

查看英文原文:Wrangling WebRTC: Challenges and Opportunities for Real-Time Communication


感谢赵震一对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。