写点什么

Zalando 公司使用 Apache Flink 进行微服务和流处理架构

  • 2016-11-06
  • 本文字数:957 字

    阅读完需:约 3 分钟

Javier Lopez 和 Mihail Vieru 日前在 Reactive Summit 2016 大会上发表了关于基于云的数据集成和分发平台的演讲,该平台可用于商业智能用户案例的流处理。

Zalando 公司是欧洲在线时尚零售商,该公司正在从整体服务架构逐渐转变为微服务架构,并且从等级组织结构向敏捷组织结构转变。

事件流的处理方式使 Zalando 的技术团队能够实现几近实时的商业智能。他们使用诸如 Flink Kafka Elasticsearch 之类的技术来处理事件流。

在他们的架构中,各应用程序通过 REST API 互相沟通,而数据库隐藏在 Amazon Virtual Private Cloud (VPC) 基础架构里面。所有团队都将数据发布到中央事件总线。该架构模型由应用程序(调用微服务(REST API)来与事件总线交互)、Kafka、Exporter 和 AWS S3 数据存储组成。他们还用 Data Lake 为数据提供分布式访问和精细的安全性保护。

Lopez 和 Vieru 讨论了如何在微服务架构中使用 Flink 框架。 Flink 用于处理基于事件、摄取和处理时间的流数据。它还负责背压处理,这种背压处理是通过系统架构隐式实现的。

Zalando 公司的业务流程涉及 1000 多种事件类型,并且每个事件类型都有一个 Kafka 主题。他们通过关联的事件类型(如 Join&Union)来分析流程,并根据业务规则完善数据。他们还使用滑动窗口(1 分钟至 48 小时)的平台快照来进行流处理。

该架构还包括用于安全性的 OAuth 、基于 Postgres DB 的配置服务、告警服务和 Python 可视化组件。

两位演讲者还探讨了流处理的两个用例:几近实时的业务流程监控解决方案和流 ETL。实时的流程监控有助于分析如订单速度、交付速度等数据流和控制服务水平协议(SLA)。流式 ETL 用于释放与关系型数据仓库相关的资源,这种解决方案有助于提高数据仓库的负载,减少延迟并使平台更具可扩展性。

他们还谈到了未来用于流处理的用例,比如几近实时的销售和价格监控以及检测欺诈性付款。BPM 和 Flink 的 CEP 库及状态功能的复杂事件处理能力将用于这些用例。

有关他们的事件流处理架构的更多详细信息,请访问该公司的博客网站

查看英文原文 Microservices and Stream Processing Architecture at Zalando Using Apache Flink


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-11-06 19:003431
用户头像

发布了 22 篇内容, 共 61900 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

华为云CodeArts TestPlan测试设计:守护产品开发质量之魂

云计算 软件开发 华为云 产品测试

通过腾讯云SES服务发送邮件

排骨虾

腾讯云 #go 邮件通知

拉链表的原理及简单实现

数新网络官方账号

大数据 拉链式散列表

BI商业智能工具改变企业发展态势

对不起该用户已成仙‖

BI商业智能工具成宠儿,企业降本增效优质工具

夜雨微澜

鲸鸿动能荣获2023 TopDigital 3项大奖

最新动态

这些面试技巧,助你升职加薪、迎娶白富美

伤感汤姆布利柏

从“云原生”到“比Flink快十倍”:RisingWave的寻找自我认知之旅

吴英骏

数据库 sql 流处理

一次搞懂线性稳压器/LDO的工作原理

元器件秋姐

物理 电路 元器件 PCB 稳压器

SpringBoot 2 种方式快速实现分库分表,轻松拿捏!

程序员小富

分库分表 springboot ShardingSphere

Android SDK安全加固问题与分析

百度Geek说

android 安全加固 企业号 6 月 PK 榜 6 月 优质更文活动

一名中级程序员应该具备的技能

树上有只程序猿

编程 程序员 低代码 职业生涯 JNPF

玖章算术与百度智能云达成合作,「NineData SQL 开发」成为百度智能云主推的数据库工具

NineData

数据库 百度智能云 云市场 玖章算术 NineData

行云管家- 积极探索“AI+信息安全”的创新融合

行云管家

网络安全 信息安全 智能 AI智能

Kafka优化

数新网络官方账号

大数据 zookeeper

hive数据迁移

数新网络官方账号

大数据 hadoop hadoop spark hive

解读 RocketMQ 5.0 全新的高可用设计

阿里巴巴云原生

阿里云 RocketMQ 高可用 云原生

使用堡垒机的意义你知道吗?能解决哪些问题?

行云管家

网络安全 信息安全 堡垒机 数据泄露

一年省七位数,得物自建HFDS在 Flink Checkpoint 场景下的应用实践

得物技术

大数据 阿里云 成本优化

AIGC+办公|大厂争先抢占高位的AI,开始“卷”打工人了吗?

TE智库

人工智能 办公 打工人 AIGC 生成式AI

Flume简述

数新网络官方账号

数据采集 flume

玖章算术与百度智能云达成合作,「NineData SQL 开发」成为百度智能云主推的数据库工具

Baidu AICLOUD

香港云主机为你的业务注入强大的云端动力!

一只扑棱蛾子

香港云主机

k8s实战案例之部署redis单机和redis cluster

不在线第一只蜗牛

k8s

车联网 CAN Bus 协议介绍与数据实时流处理

EMQ映云科技

物联网 mqtt canbus

如何使用 Terraform 和 Git 分支有效管理多环境?

SEAL安全

git Terraform

svn提交规范,与Git相得益彰

互联网工科生

git svn

Zalando公司使用Apache Flink进行微服务和流处理架构_大数据_Srini Penchikala_InfoQ精选文章