在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

Netflix 发布 Genie3

  • 2017-07-16
  • 本文字数:946 字

    阅读完需:约 3 分钟

Genie 是一个分布式的 RESTful 架构的任务编排引擎,用于 Netflix 的数据平台。Genie 有两个主要使用场景:第一个是创建和提交自定义的数据处理任务请求,其次是设置本地环境来开发和测试在 Genie 集群上运行的新应用程序和任务。

Netflix 宣布 Genie3 支持几项新特性,包括对较早的任务执行引擎进行重新设计、增强安全功能、增加依赖关系缓存,同时API 也有更新。

Genie 引擎的早期版本不支持领导选举,导致工作节点不必要地执行相同的任务。现在,通过 Zookeeper 或手动配置属性设置单个节点的 IP 地址即可支持集群领导选举。早期版本中所有任务的单一运行脚本运行时间过长,无法满足安全隔离的要求,并降低了在项目扩张阶段项目维护者引入代码更改时隔离风险的能力。Genie3 引入新的方法,使用改进的数据模型来保证运行时间并实现了配置的模块化、描述性和版本化。

在 Genie3 中,任务由若干抽象过程组成,以确保可扩展性。应用程序的运行时间和可执行命令可以通过其API 进行配置。Genie 独立于特定运行时配置或待处理数据,生成Spark、Hadoop、Pig、Hive、PrestoDB 和Sqoop 等类型的应用程序运行脚本。作为开发人员,本地模式工作流能够为不同运行时生成运行脚本,同时还集成了REPL 和stdout 的底层实现以支持测试和开发。

Genie3 的 API 组件覆盖了 Genie 的全部功能。

集群 API、命令 API、应用 API 和作业 API 提供了操作 Genie3 所需的语义。集群 API 负责管理 Genie 的逻辑 worker 集群,不包括基础架构本身。集群 API 还协助管理集群相关的元数据、启动时 worker 集群的基准状态、可用于集群的命令和基准包的安装。从这一点来看它与 Puppet 或 Chef 类似,只是它专注于 Genie 应用程序命令在运行时所需的工作集群的特定安装包和配置。这样可以使应用程序在启动时更加灵活、不受限制,否则应用程序就需要在启动时下载并安装依赖包。

命令 API 的语义在底层应用程序上运行,并且必须指向特定应用程序,但允许定义自己的启动和运行时配置。

作业 API 允许 Genie 用户调度或执行一组命令,并跟踪有关作业执行状态的数据。Genie3 附带了用于 MySql、PostgreSQL 和 HSQLDB 的 JDBC 驱动程序,用于支持 Genie 及其 API 的存储配置。

Genie 3 还支持基于 OAuth2 X.509 公钥证书。

查看英文原文: Netflix Announces Genie 3

感谢张卫滨对本文的审校。

2017-07-16 18:423782
用户头像
蔡芳芳 InfoQ 总编辑

发布了 851 篇内容, 共 632.5 次阅读, 收获喜欢 2828 次。

关注

评论

发布
暂无评论
发现更多内容

AI 对话式分析:让业务数据开口说话,让决策及时有效

数据集成与治理

FineBI

YashanDB数据库开发指南:从入门到精通

数据库砖家

工业数据消费迎来“抖音式”革命:TDengine IDMP 让数据自己开口说话

TDengine

大数据 tdengine 运维 idmp

Dify知识库调优秘籍:6步精准改造,让AI回答从此可靠无误

测吧(北京)科技有限公司

flink-cdc之mysql到es

天翼云开发者社区

数据库

工业数字化 信息化经验总结(6)

万里无云万里天

数字化转型 信息化 工业 工厂运维

AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型

汀丶人工智能

黑龙江等保测评新流程:定级备案的深化与细化

等保测评

合理选择任务调度的路由策略,可以帮助降本 50%

阿里巴巴云原生

阿里云 云原生 任务调度

黑龙江等保测评合格标准与实施路径:确保信息系统安全稳定运行

等保测评

强化学习的 “GPT-3 时刻” 即将到来

Baihai IDP

人工智能 AI 强化学习

通过ETL工具,同步SQLserver数据至starrocks数据库

谷云科技RestCloud

数据传输 数据同步 ETL SqlServer StarRocks

办公常用的多屏协同工具有哪些?5个国内外主流应用盘点

职场工具箱

效率工具 在线白板 办公软件 在线协作 多屏协同

2025年黑龙江等保测评注意事项大盘点

等保测评

YashanDB数据库开发者常用命令及其解读

数据库砖家

百度智能云,造出了AI时代的擎天柱

脑极体

AI

IPD中的扫地僧(TDT技术开发团队),都在扫什么?

IPD产品研发管理

技术 后端 IPD 产品研发 集成产品开发

YashanDB数据库跨平台兼容性及应用前景分析

数据库砖家

从HPACK到多路复用,揭秘HTTP/2如何终结网络拥堵

poemyang

网络协议 RPC HTTP2.0 RPC架构

10分钟无痛部署!字节Coze开源版喂饭教程

测吧(北京)科技有限公司

AI+软开-软件开发企业的数字化转型

lsycang

软通动力2025半年报:营收稳步攀升,全栈智能点亮发展新局

财见

增强式 BI:让数据会推理,让决策更简单

数据集成与治理

FineBI

恒香全新旗舰店开幕 新店传承百年文化

编程猫

YashanDB数据库快速入门教程与实用技巧

数据库砖家

工业管理 团队建设经验总结(3)

万里无云万里天

项目管理 工业 工厂运维

大数据-81 Spark 手把手搭建 分布式计算环境:从下载配置到多节点部署

武子康

Java 大数据 flink spark 分布式

从“读标签”到“懂场景”,RFID识别再突破,斯科CK-T4获得IOTE金奖2025创新产品

斯科信息

斯科信息 AI算法RFID门禁 RFID智能门禁

YashanDB数据库可扩展性设计分析与实现

数据库砖家

Netflix发布Genie3_大数据_Dylan Raithel_InfoQ精选文章