写点什么

AWS 推出 Apache Airflow 全托管工作流 MWAA

  • 2020-12-09
  • 本文字数:1362 字

    阅读完需:约 4 分钟

AWS推出Apache Airflow全托管工作流MWAA

最近,AWS 推出了亚马逊Apache Airflow托管工作流(MWAA),这是一项全托管的服务,简化了在 AWS 上运行开源版 Apache Airflow 和构建工作流来执行 ETL 作业和数据管道的工作。


Apache Airflow 是一个开源工具,用于通过编程的方式开发、调度和监控被称为“工作流”的过程和任务序列。开发人员和数据工程师用 Apache Airflow 管理工作流,通过用户界面(UI)来监控它们,并通过一组强大的插件来扩展它们的功能。但是,要使用 Apache Airflow,需要进行手动安装、维护和扩展。现在,AWS 解决了这个问题,它为开发人员和数据工程师提供了 MWAA,让他们可以在云端构建和管理自己的工作流,无需关心与管理和扩展 Airflow 平台基础设施相关的问题。


在 AWS 有关 MWAA 的新闻稿中,负责应用集成的副总裁 Jesse Dougherty 说:


客户告诉我们,他们非常喜欢 Apache Airflow,因为它加快了数据处理和机器学习工作流的开发,但他们希望能够去掉扩展、运维和保护服务器方面的负担。通过使用 Amazon MWAA,客户可以使用与现在相同的 Apache Airflow 平台,同时获得由 AWS 提供的可伸缩性、可用性和安全性。


Amazon MWAA 可以使用Amazon Athena获取来自数据源(如Amazon Simple Storage Service)的输入,在Amazon EMR集群上执行转换,并使用生成的数据在Amazon SageMaker上训练机器学习模型。此外,开发人员和数据工程师可以使用 Python 在 Amazon MWAA 中编写有向无环图(DAG)工作流。



来源:https://aws.amazon.com/managed-workflows-for-apache-airflow/


AWS 首席布道师 Danilo Poccia 在 NWAA 的一篇介绍博文中写道:


你可以通过以下三个步骤来使用亚马逊 MWAA:

创建环境——每个环境都包含你的 Airflow 集群,包括调度器、工作程序和 Web 服务器。开发人员和数据工程师可以从控制台、AWS命令行接口(CLI)或AWS SDK创建新的 Amazon MWAA 环境。

上传 DAG 和插件到 S3——Amazon MWAA 自动将代码加载到 Airflow 中。

在 Airflow 中运行 DAG——从 Airflow UI 或命令行(CLI)运行 DAG,并使用 CloudWatch 监控环境。


有了 MWAA,开发人员和数据工程师可以通过插件获得开放可扩展性所带来的好处,他们可以创建与工作流所需的 AWS 或内部资源发生交互的任务,包括 AWS Batch、Amazon CloudWatch、Amazon DynamoDB、AWS Lambda、Amazon Redshift、Amazon Simple Queue Service (SQS)和 Amazon Simple Notification Service(SNS)。


需要注意的是,AWS 还有其他工作流管理系统,比如Step FunctionsAWS Glue。Hacker News 上的一位受访者在一篇帖子中解释说:


它是由内部的 Orchestration 团队开发的——这个团队也开发了 Step Functions,并维护着AWS Simple Workflow。我认为 Glue 与其他的工作流系统不一样——它针对 ETL 进行了深度优化。我相信,随着时间的推移,会出现更多有关 Step Functions 和 Apache Airflow 的详细指南,不过简单地说,Step Functions 是完全 AWS 原生的(并且是无服务器的)编配引擎。当然,Apache Airflow 是一个开源的项目,它拥有一个由其他插件组成的多样化生态系统。


MWAA 目前可在下列 AWS 区域使用:美国东部(俄亥俄州和弗吉尼亚州)、美国西部(俄勒冈州)、欧盟(斯德哥尔摩、爱尔兰和法兰克福)和亚太地区(东京、新加坡和悉尼),其他更多地区将会陆续可用。此外,有关服务的详细信息可以在文档页面上获得,有关价格的详细信息可以在定价页面上获得。


原文链接


AWS Introduces Amazon Managed Workflows for Apache Airflow


2020-12-09 16:003926

评论

发布
暂无评论
发现更多内容

精彩抢先看 | 博睿数据将受邀出席GOPS全球运维大会2025北京站!

博睿数据

从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变?

合合技术团队

人工智能 算法 #大数据

CST的热仿真THs稳态求解器--针式散热片

思茂信息

cst CST软件 CST Studio Suite

支持 4K/HDR/杜比视界!nPlayer for Mac

Rose

企业带宽租赁的优势与应用场景有哪些?

Ogcloud

带宽租用 带宽租赁 大带宽 机房大带宽 大带宽租用

AI智能体终结运维"狼来了"

权说安全

AI 安全运维

mac吉他原生插件 Ample Sound Ample Guitar M

Rose

QT软件外包开发流程

北京木奇移动技术有限公司

软件外包公司 QT软件开发 QT外包公司

KOL技术圈 | 下一代智能可观测平台长什么样?来看Bonree ONE的极致演绎!

博睿数据

专业的科学和工程分析软件 WaveMetrics Igor Pro 9 Mac

Rose

【重磅】JimuReport 积木报表 v2.0 版本发布,免费可视化报表

JEECG低代码

数据可视化 报表 积木报表 报表工具 积木BI

深入研究:shopee商品详情API接口Python攻略

tbapi

shopee商品详情接口 shopee数据采集 shopee数据接口

BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践

百度安全

OpsPilot 智能体:打破工具孤岛、降低人为失误,优化运维流程

嘉为蓝鲸

智能运维 #WeOps OpsPilot

嘉为蓝鲸WeOps:集成主流云服务商,自动化证书申请 + 一键部署全流程提速

嘉为蓝鲸

SSL证书 #WeOps 一体化运维

选择GPU云服务器供应商的注意事项

Ogcloud

gpu 云服务商 GPU云服务器 GPU云服务器供应商

构建精细化DevOps权限体系:从数据级管控到全局授权

嘉为蓝鲸

DevOps 智能运维

DeepChat for mac您的桌面AI伙伴

Rose

警惕!这3个AI测试用例陷阱,让80%的团队白忙一场...

测试人

人工智能

cinema 4d 2024-c4d中文版激活教程【Mac/win】

Rose

TK海外抢单网站源码/前后端分离,前端uniapp,后端php

网站,小程序,APP开发定制

GAITC 2025:曙光AI基础设施全栈亮相

科技热闻

一场 6 点半开启的慢跑,是我们对八周年最真实的记录

TDengine

数据库 tdengine 时序数据库

视觉效果和图像处理 Boris FX Silhouette 2025新功能详解

Rose

矢量绘图设计CDR 2025 永久许可证【Mac/win】

Rose

DVD光盘刻录 Toast Titanium 17 Mac中文注册版

Rose

嘉为蓝鲸可观测系列产品入选Gartner《中国智能IT监控与日志分析工具市场指南》

嘉为蓝鲸

Gartner 可观测

3D建筑建模 Vectorworks2024破解安装教程【Mac&win】

Rose

当AI遇上供应链 第七在线助力精准决策

第七在线

为什么有的企业上了ERP还要上MES?

积木链小链

数字化转型 ERP 智能制造 mes

BricsCAD 23 for Mac(CAD建模软件)v23.2.07中/英文永久激活版

Rose

AWS推出Apache Airflow全托管工作流MWAA_服务革新_Steef-Jan Wiggers_InfoQ精选文章