写点什么

Falcor:Netflix 的数据抓取开源库

  • 2015-08-24
  • 本文字数:1465 字

    阅读完需:约 5 分钟

作为一家在线影片租赁供应商, Netflix 通过移动应用、桌面应用或 TV 来为用户提供电影和电视节目。在使用过程中,用户总是需要通过这些应用来获取位于服务器的远端数据资源。近日,为了提高远程数据抓取的效率,Netflix 发布了全新数据平台 Falcor 的开发者预览版。接下来,本文对 Falcor 进行简要介绍。

Falcor 的设计目标并不是用来替代应用服务器、数据库或者 MVC 框架。其功能是作为中间件,来优化应用程序不同层之间的通信效率。之前,Netflix 已经提出了 JSON Graph 的概念,来把 Graph 数据转变为 JSON 对象。该 JSON 格式可以消除传统 JSON 格式引入的重复数据问题,并提高数据传输的效率。Falcor 利用了该 JSON 格式,允许应用程序把所有远端的数据源用一个单独的 JSON Graph 来表示,提高数据抓取的效率。而且,用户仍然可以使用 get、set 和 call 等熟悉的 JavaScript 方法进行数据读取等操作。Falcor 的一个理念就是,用户只要熟悉数据,就熟悉其 API。此外,当用户需要访问数据时,Falcor 会根据需求保证尽可能少的数据传输,同时保证大量数据传输的高效性。

Falcor 的特点主要表现为三个方面——一个模型随处使用、数据即是 API 和云绑定。当使用 Falcor 时,客户端仍然像请求本地 JSON 对象一样请求远端的 JSON 资源。为了获得远端服务器中 JSON 资源中的值,客户端需要把服务器 JavaScript 的路径传递到 JSON 对象内的每一个希望获得的值中。然后,服务器就会把只包含这些值的 JSON 对象的子集返回到客户端。这样,客户端就可以把请求的多个数据轻松封装到一个 URL 请求中。为了保证应用服务器处于无状态模式,Falcor 在处理请求的路径中加入了专门的路由器。这些路由器根据一个或多个 JavaScript 路径,来把请求发送到不同的服务器中。而且,路由器只向客户端暴露出了一个单独的 JSON 模型,使得客户端可以轻松获取来自不同服务器的数据。这种机制也就保证了 Falcor 的一个模型随处使用的特性。

另外一方面,Falcor 并不需要用户来重新了解一些复杂的服务层。Falcor 把远程数据封装为与本地数据同样的接口。客户端仍然可以使用类似的 JavaScript 路径和操作来处理数据。二者最大的差别只在于 Falcor 的客户端 API 是异步的。这样,服务器端的数据就可以自由移动,并不会影响到客户端的代码。最后,云绑定体现为 Falcor 采用的异步 MVC 模式。在 Falcor 中,视图、模型以及控制器之间的通信都是异步的。这样,在视图驱动数据抓取时,只有渲染一个视图需要的那部分数据被抓取,有效保证了通信数据的最小化。

此外,为了提高通信的效率,Falcor 采用了缓冲、打包和去重三种策略。缓冲策略会把请求的数据暂存在本地。这样,下次同样的请求就可以直接从本地获取,大大减少通信量和响应时间。打包策略负责把若干小的请求汇集为一个大的请求,可以大大提高有效载荷的比例。去重策略则对请求进行过滤,去除不必要的请求。

目前,开发人员已经可以通过 Falcor 官方网站 GitHub 或者 npm 来下载开发者预览版 Falcor。除了一些相对成熟的模块,该版本中包含了产品中还未使用的 Falcor 路由器的 Node 版本。 Netflix 官方表示,其开发团队目前仍处在积极进行 Falcor 的网上工作。Falcor 的发展路线图将在不久之后给出。Netflix 希望通过本版本的发布,获得广大开发人员的反馈,从而为正式版的开发打好基础。


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-08-24 19:024786
用户头像

发布了 268 篇内容, 共 131.3 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

TL如何在团队中培养出更多前端技术专家

贵重

大前端 团队建设 技术管理

和儿子装一台 Hackintosh

苏锐

DIY Hackintosh 装机

CentOS7使用Iptables做网络转发

wong

Centos 7 iptables

Mac 自带软件-聚焦搜索

Winann

macos Mac spotlight

CTO股权”避坑“,你根本不知道我们多努力

赵新龙

TGO鲲鹏会 股权 CTO

云函数中使用Python-ORM: Peewee

刘宇

抽象

落英亭郎

系统设计 面向对象 抽象

Web3极客日报#136

谢锐 | Frozen

区块链 独立开发者 技术社区 Rebase Web3 Daily

《CSS 选择器世界》读书笔记

云走

CSS Java html 读书笔记 大前端 张鑫旭

带你100% 地了解 Redis 6.0 的客户端缓存

程序员历小冰

redis 缓存 redis6.0.0

找到自己的领域,然后封神

一尘观世界

成长 提升 领域 机遇 趋势

回文串解题记录

晓刚学代码

Java 算法

我的编程之路-3(熟练)

顿晓

c++ 调试 经历 项目 疑问

Spring Boot可执行JAR的原理

小判

Spring Boot 类加载 Fat-JAR deflate JAR URL

基于Serverless架构的Git代码统计

刘宇

(乱记)“怎样培养优秀孩子”

启润

MacOS使用指南之我并不需要系统菜单栏

lmymirror

macos 高效工作 完美主义 操作系统 新手指南

Web3极客日报#137

谢锐 | Frozen

区块链 独立开发者 技术社区 Rebase Web3 Daily

个人的投资原则

史前靓仔

引入了绩效管理,团队反而一天不如一天了?(一)

Geek_6rptuk

团队管理 企业文化 绩效

人生就是一场说走就走的旅行

kimmking

回"疫"录(13):不信谣,不传谣

小天同学

疫情 回忆录 现实纪录 纪实 谣言

Flink 1.10 细粒度资源管理解析

Apache Flink

大数据 flink 流计算 实时计算

谈一谈自由职业者的心态

Bob Jiang

自由职业 写作 心态 营销

可能是最最最最简单的搭建博客方法

彭宏豪95

GitHub 写作 博客 GitPress

《Linux就该这么学》笔记(一)

编程随想曲

Linux

【Howe 学 JAVA】Java 类集框架2——集合输出

Howe

Java 集合 输出 类集

当你不知道怎么学习新技术时

石君

学习 方法论

裸机Ubuntu18.04 配置实现人脸识别的第三方库

月夜

dlib face_recognition 人脸识别 环境配置

我跑步的时候会想些什么

养牛致富带头人

跑步 运动 锻炼

你觉得你是哪类人?

Janenesome

读书笔记 思考

Falcor:Netflix的数据抓取开源库_语言 & 开发_张天雷_InfoQ精选文章