写点什么

Falcor:Netflix 的数据抓取开源库

  • 2015-08-24
  • 本文字数:1465 字

    阅读完需:约 5 分钟

作为一家在线影片租赁供应商, Netflix 通过移动应用、桌面应用或 TV 来为用户提供电影和电视节目。在使用过程中,用户总是需要通过这些应用来获取位于服务器的远端数据资源。近日,为了提高远程数据抓取的效率,Netflix 发布了全新数据平台 Falcor 的开发者预览版。接下来,本文对 Falcor 进行简要介绍。

Falcor 的设计目标并不是用来替代应用服务器、数据库或者 MVC 框架。其功能是作为中间件,来优化应用程序不同层之间的通信效率。之前,Netflix 已经提出了 JSON Graph 的概念,来把 Graph 数据转变为 JSON 对象。该 JSON 格式可以消除传统 JSON 格式引入的重复数据问题,并提高数据传输的效率。Falcor 利用了该 JSON 格式,允许应用程序把所有远端的数据源用一个单独的 JSON Graph 来表示,提高数据抓取的效率。而且,用户仍然可以使用 get、set 和 call 等熟悉的 JavaScript 方法进行数据读取等操作。Falcor 的一个理念就是,用户只要熟悉数据,就熟悉其 API。此外,当用户需要访问数据时,Falcor 会根据需求保证尽可能少的数据传输,同时保证大量数据传输的高效性。

Falcor 的特点主要表现为三个方面——一个模型随处使用、数据即是 API 和云绑定。当使用 Falcor 时,客户端仍然像请求本地 JSON 对象一样请求远端的 JSON 资源。为了获得远端服务器中 JSON 资源中的值,客户端需要把服务器 JavaScript 的路径传递到 JSON 对象内的每一个希望获得的值中。然后,服务器就会把只包含这些值的 JSON 对象的子集返回到客户端。这样,客户端就可以把请求的多个数据轻松封装到一个 URL 请求中。为了保证应用服务器处于无状态模式,Falcor 在处理请求的路径中加入了专门的路由器。这些路由器根据一个或多个 JavaScript 路径,来把请求发送到不同的服务器中。而且,路由器只向客户端暴露出了一个单独的 JSON 模型,使得客户端可以轻松获取来自不同服务器的数据。这种机制也就保证了 Falcor 的一个模型随处使用的特性。

另外一方面,Falcor 并不需要用户来重新了解一些复杂的服务层。Falcor 把远程数据封装为与本地数据同样的接口。客户端仍然可以使用类似的 JavaScript 路径和操作来处理数据。二者最大的差别只在于 Falcor 的客户端 API 是异步的。这样,服务器端的数据就可以自由移动,并不会影响到客户端的代码。最后,云绑定体现为 Falcor 采用的异步 MVC 模式。在 Falcor 中,视图、模型以及控制器之间的通信都是异步的。这样,在视图驱动数据抓取时,只有渲染一个视图需要的那部分数据被抓取,有效保证了通信数据的最小化。

此外,为了提高通信的效率,Falcor 采用了缓冲、打包和去重三种策略。缓冲策略会把请求的数据暂存在本地。这样,下次同样的请求就可以直接从本地获取,大大减少通信量和响应时间。打包策略负责把若干小的请求汇集为一个大的请求,可以大大提高有效载荷的比例。去重策略则对请求进行过滤,去除不必要的请求。

目前,开发人员已经可以通过 Falcor 官方网站 GitHub 或者 npm 来下载开发者预览版 Falcor。除了一些相对成熟的模块,该版本中包含了产品中还未使用的 Falcor 路由器的 Node 版本。 Netflix 官方表示,其开发团队目前仍处在积极进行 Falcor 的网上工作。Falcor 的发展路线图将在不久之后给出。Netflix 希望通过本版本的发布,获得广大开发人员的反馈,从而为正式版的开发打好基础。


感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-08-24 19:025006
用户头像

发布了 268 篇内容, 共 137.7 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

考虑YashanDB数据库迁移?这7个问题你不得不问!

数据库砖家

深度解析YashanDB数据库索引机制,提升查询效率

数据库砖家

用于 syslog 收集的协议:TCP、UDP、RELP

运维有小邓

syslog Syslog日志管理

PPT软件有哪些?2个好用的AI生成PPT工具盘点

职场工具箱

效率 AI PPT 办公软件 AI生成PPT

高性能数据导入导出:YashanDB数据库工具使用指南

数据库砖家

深度解析YashanDB数据库事务日志原理

数据库砖家

请终结你的“混乱”工具库房,复制落地篇:工厂维修车间RFID智能工具库房管理方案

斯科信息

RFID解决方案 斯科信息 RFID智能工具库房 RFID智能工具柜

校园跑腿外卖论坛团购盲盒小程序:一体化校园服务解决方案

微擎应用市场

深度解析YashanDB数据库的性能瓶颈

数据库砖家

面向大规模并发访问的YashanDB数据库架构设计

数据库砖家

面向移动互联网应用的YashanDB数据库优化方法

数据库砖家

YashanDB数据库应用示例

数据库砖家

深度分析YashanDB数据库的功能特点

数据库砖家

深度解析YashanDB数据库存储引擎构造原理

数据库砖家

深度剖析YashanDB,助力企业实现高效数据管理

数据库砖家

AI智能体的开发优化

北京木奇移动技术有限公司

AI智能体 AI技术开发 软件外包公司

解密YashanDB数据库的高性能查询能力

数据库砖家

跨越数据孤岛:YashanDB数据库的集成能力

数据库砖家

深度解析YashanDB数据库的事务处理机制

数据库砖家

高性能应用中YashanDB的最佳配置方案

数据库砖家

评估YashanDB数据库在数据安全中的有效性

数据库砖家

确保YashanDB高可用性的实用策略

数据库砖家

区块链 Web3 应用的开发周期和费用

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

比价寄快递独立版:快递行业解决方案

微擎应用市场

青农陪诊管理系统:一站式智慧陪诊服务平台详解

微擎应用市场

搭建高性能YashanDB数据库环境的关键步骤

数据库砖家

解决YashanDB数据库中的性能瓶颈问题

数据库砖家

深度解析YashanDB数据库的索引设计与优化策略

数据库砖家

PaddleMIX推出扩散模型推理加速Fast-Diffusers:自研蒸馏加速方法FLUX-Lightning实现4步图像生成

百度Geek说

jobleap.cn是干什么用的?

Y11

面试 找工作 简历 笔试 找实习

破解YashanDB数据库的性能瓶颈与解决方案

数据库砖家

Falcor:Netflix的数据抓取开源库_语言 & 开发_张天雷_InfoQ精选文章