写点什么

Jay Kreps 谈基于 Apache Kafka 和 Kafka Streams 的分布式流处理

  • 2016-10-19
  • 本文字数:1116 字

    阅读完需:约 4 分钟

借助 Apache Kafka Kafka Streams 框架可以更好地搭建以流为中心的架构和开发分布式流处理应用程序。Confluent 的 CEO Jay Kreps 在上周举行的 2016 响应式峰会上为我们带来了有关流处理和微服务的演讲

Jay 说,人们已经在数据库技术上做了很多研究,但在消息队列上做得并不多。在基于微服务的系统架构里,消息传递可以作为服务的强有力后盾。

他提到了三种编程范式:请求 / 响应、批处理和流处理,以及这三种范式之间的区别。流处理同时适用于在线和批处理两种场景。流处理并不是更快的 MapReduce,而是处理和分析数据的另一种范式。Jay 介绍了 Kafka 的四种有关流处理的核心API :Producer、Consumer、Connector 和Streams。

Kafka Streams 是一个 Java 类库,可以用来构建具有容错能力的分布式流处理应用程序。它支持 map、filter、aggregate(count、sum)和 join 这些方法。

在大会的另一个演讲里,来自UC Santa Cruz 的 Peter Alvaro 谈到如何为大规模分布式容错系统做自动故障测试。他提到了沿袭驱动故障注入(Lineage-Drive Fault Injection, LDFI )方法,这种方法利用日志跟踪信息来识别冗余计算,有助于测试的进行。

Peter 总结了系统故障测试需要具备的四个条件:

  • 真实的问题
  • 真实的系统
  • 思考时间
  • 故障自由

关于这个话题的更多信息,可以在 Netflix博客上看到。

大会第二天的活动内容包括Jan Machacek 带来的“从单体到微服务”以及Anil Gursel 和Akara Sucharitakul 带来的“使用Akka Streams 和Kafka 进行回压”。

Jan Machacek 介绍了如何使用 Akka、Scala 和 Kafka 开发一个微服务系统。这个系统还使用了 Apache Cassandra 作为数据存储,还有 RabbitMQ,以及在 Apache Spark 里运行的批处理分析代码。他建议我们在开发分布式系统时要有很好的监控和跟踪能力。每个微服务都可能会发布自己的内部 API,开发者们要知道如何使用它们。

Anil Gursel 和 Akara Sucharitakul 讲述了他们在 PayPal 利用 Akka Streams 和 Kafka 的回压能力来应对突发性负载的经历。他们举了一个 Web 爬虫的例子,并告诉我们他们是如何利用 Kafka 的缓冲能力和 Akka Streams 的回压异步处理能力来应对突发性负载的。

Akka Streams 框架提供了纯异步流处理,具有响应式流的特点。他们还讲到了 Squbs ,Squbs 是 PayPal 开发的一个响应式平台,并具有引导启动、生命周期管理能力,可以用于构建松耦合的模块化系统,并为日志和监控提供了集成接口。

查看英文原文: Jay Kreps on Distributed Stream Processing with Apache Kafka and Kafka Streams


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-10-19 19:003302
用户头像

发布了 322 篇内容, 共 156.3 次阅读, 收获喜欢 148 次。

关注

评论

发布
暂无评论
发现更多内容

NineData 亮相新加坡 Tech Week 2025,为全球企业提供 AI 数据管理方案

NineData

数据复制 玖章算术 NineData 新加坡科技周 AI数据管理

双碳目标下企业零碳转型的 MyEMS 碳流可视化支撑体系:路径探索与效能评估

开源能源管理系统

开源 能源管理系统

国际化 App 开发流程

北京木奇移动技术有限公司

APP开发 软件外包公司 国际化APP

采用 Flutter 开发小程序并整合为 App,是否能让 App 开发更高效?

xuyinyin

区块链Web3项目的开发流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

案例解析 | 斯科信息RFID云仓项目应用

斯科信息

斯科信息 RFID仓储通道门 RFID隧道机

架构剖析:Playwright MCP Server 的工作原理与性能优化最佳实践

测试人

软件测试

CST软件教程:利用OPERA和CST研究行波管ppm聚焦系统中的传输问题

思茂信息

cst cst电磁仿真 CST软件 CST Studio Suite

低代码应用菜单避坑指南:新建 / 删除 / 导入全流程,路由重复再也不怕!

引迈信息

如何设计10亿用户级的微博Feed流系统并应对100W QPS的挑战?

测试人

信创合规+效能双升!嘉为蓝鲸2025CTeam敏捷协同平台:一站式Jira迁移筑牢研发协同底座

嘉为蓝鲸

需求管理 研发协同 研发项目管理 敏捷协同平台 敏捷协同

Web3 项目的开发及费用

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

CAD尺寸标注如何隐藏与显示?

在路上

cad CAD看图王

MyEMS + 边缘网关:偏远基站如何实现 “无人值守” 下的精准能耗管理?

开源能源管理系统

开源 能源管理系统

直播预告丨数智领航,AI践未来:人工智能+风潮下数据智能基础设施建设圆桌论坛即将开启

数新网络官方账号

分布式共识的哲学

陈一之

分布式系统 架构师 技术思维

DDD本质论:从哲学到数学,再到工程实践的完整指南之实践篇

canonical

领域驱动设计 DDD 可逆计算 Nop平台

全球社交媒体监测平台如何做好媒体监控工作?

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

CAD软件中的模型空间和布局空间你了解吗?

在路上

cad cad看图 CAD看图王

在线编辑DWG SDK的集成方法

WEB CAD SDK

30天冲刺爆单季:黑五网一卖家完整备战指南

Wolink

跨境贸易 出海企业 海外营销推广 达人营销

企业必看:AD 账号未清理的三大危害

运维有小邓

AD域 AD域管理

混合应用开发:2025 企业移动开发降本增效之道

xuyinyin

HAIDAKHAN数据库遭黑客攻击完整事件分析

qife122

网络安全 漏洞挖掘

国外社交媒体监测软件在实际工作中具体是做什么的?

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

开源鸿蒙技术大会2025 | 教育分论坛:开源赋能教育,融合培育未来

科技热闻

AI赋能研发效能!嘉为蓝鲸2025DevOps研发效能平台:7大产品覆盖需求到交付全链路

嘉为蓝鲸

项目管理 DevOps 需求管理 研发效能 研发效能分析

Volcano v1.13 重磅发布!大模型训练与推理等调度能力全面增强

华为云原生团队

云计算 容器 云原生 Volcano

当 Pudgy Penguins 走进首尔:PENGU 在韩国市场的全新玩法

股市老人

开源鸿蒙技术大会2025 | AI软件工程分论坛:智能创新,赋能开源鸿蒙软件工程

科技热闻

数据赋能 | STEM学科数据如何助力教育大模型深度进化?

数据堂

人工智能 数据集 大模型 STEM教育 教育大模型

Jay Kreps谈基于Apache Kafka和Kafka Streams的分布式流处理_大数据_Srini Penchikala_InfoQ精选文章