【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

物联网 (IOT) 时代的流处理和消息系统

  • 2016-06-26
  • 本文字数:1409 字

    阅读完需:约 5 分钟

本篇是 O’Reilly Data Show 的一个采访实录,大数据公司 MapR 联合创始人、Uber 首席架构师 M.C. Srivas 讲述 IOT 时代的流处理和消息系统 。主持人和 Srivas 讨论了他在数据管理和开发分布式系统的经验。在 Srivas 的职业生涯中,他负责的友分布式系统、数据库、查询引擎、消息系统等。

Srivas 指出,上述系统广泛的部署在企业中,这些企业要求系统具有安全、容灾和支持多数据中心的功能。主持人和 Srivas 聊了很多主题,这里重点聚焦在实时系统和应用上。下面是谈话的一些亮点:

运行在多数据中心的应用和系统

广告服务需要在 70 到 80 毫秒限制内返回给广告商。当你点击一个页面,广告栏、侧边栏和底部的广告不得不在 80 毫秒返回结果。客户的数据中心遍布世界各地,日本、中国、新加坡、香港、印度、俄国、德国等。他们把各数据中心的数据发送到主数据中心来进行整个点击数据的处理,然后返回给用户。

他们需要一种清晰的方法让这些点击数据返回主数据中心,主数据中心可能运行在美国、日本或者德国,或者其他地方。一般情况下会在每个地方通过完全独立的 Kafka 集群实现,但有时会出现跨集群生产者和消费者不协调。比如,在日本数据中心有一个 Kafka 集群在运行,但在香港的 Kafka 集群不能进行故障切换。因为香港的 Kafka 集群是完全独立的,它并不能监测到日本数据中心的什么数据被消费了和什么数据产生了。如果消费者在日本的 Kafka 集群消费数据并迁移到香港的 Kafka 集群,他们会变成脏数据。许多客户在咨询这方面问题的解决方法。

数据源现在不是发送到几个数据中心,而是百万个数据中心。想象一下自动驾驶汽车,每个自动驾驶汽车好比一个数据中心,它生成很多数据。再看一下飞机,它也是一个大的数据中心,这些都是我们需要为规模化 IOT 所需要做的。

物联网时代的流处理和消息系统

一个文件系统是庞大的,你写入文件,读取文件,文件系统是怎样获取到你感兴趣的文件?如果我查看一个流处理系统,我正在查询的是一个完全实时的。如果一个发布者发布了一些数据,所有在相同数据中心的相关监听者需要在五毫秒钟获取通知。如果我们的数据中心跨越半个地球,你在日本数据中心发布数据,那南非或者其他地方的数据中心要在一秒之后才能获取到信息。

我们学习 Kafka、Tibco、RabbitMQ 等技术,也学习了很多监听数据的知识,来解决流处理和消息系统的问题。这是物联网 IOT 时代所需要的。

世界范围内最大的生物识别系统

我们完成生物识别系统 Aadhaar ,它能关联你的银行账户、医院就诊以及其他所有的数据记录——比如,学校入学、航空安检、护照等。现在大约有十亿人已具有这种生物识别,还有 300 万即将完成。如果你想从 ATM 机中取钱,你只要刷指纹即可取钱,而不需要一张银行卡。

Strata San Jose 2016 session: “ Real-time Hadoop: What an ideal messaging system should bring to Hadoop ” (featuring Ted Dunning of MapR)
Strata San Jose 2016 session: “ When one data center is not enough: Building large-scale stream infrastructure across multiple data centers with Apache Kafka
Architecting the World’s Largest Biometric Identity System
Srivas was on a panel on Stream Processing Systems that I moderated in early January .

译者介绍

侠天,专注于大数据、机器学习和数学相关的内容,并有个人公众号:bigdata_ny 分享相关技术文章。

查看英文原文: Stream processing and messaging systems for the IoT age

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-06-26 17:004662
用户头像

发布了 43 篇内容, 共 27.7 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

组装式应用新趋势:小程序技术科提高软件开发效率

FinFish

小程序容器 组装式应用 小程序技术

dubbo Triple 统一参数验证

昵称不能为null

dubbo triple协议 参数验证

一个基于序列的弱监督视觉信息抽取学习框架

合合技术团队

人工智能 计算机视觉 OCR

探索大语言模型垂直化训练技术和应用-陈运文

NLP资深玩家

人工智能 ChatGPT

Go 第三方 log 库之 logrus 使用

江湖十年

后端 日志 Go 语言

技术领导力之路 - 安全感

阿里技术

技术成长

面试造飞机? 网易在职顶级大佬“java面试真题 2023” (助上岸)

三十而立

政企中小微客户业务一线支撑赋能

鲸品堂

通信 运营商 电信运营商 企业号 3 月 PK 榜

电脑风扇控制软件:Macs Fan Control Pro中文激活版

真大的脸盆

Mac Mac 软件 电脑风扇控制 风扇转速控制

基于飞桨实现的特定领域知识图谱融合方案:ERNIE-Gram文本匹配算法

飞桨PaddlePaddle

PopupWindow(悬浮框)的基本使用

二哈侠

android AlertDialog PopupWindow

架构实战 - 模块 9 毕业项目

mm

#架构实战营

PyTorch 深度学习实战 |用TensorFlow训练神经网络

TiAmo

神经网络 tensorflow MNIST

阿里云资深技术专家闫卫斌:打造具备极致容灾能力的对象存储

云布道师

阿里云 云存储

OpenAI创始人:GPT-4的研究起源和构建心法

OneFlow

人工智能 深度学习 ChatGPT Greg Brockman

如何自动化测试你的接口?—— Rest Assured

JAVA旭阳

Java springboot

浪潮 KaiwuDB x 河工大 | 推进能源行业数字化转型建设

KaiwuDB

解决方案 数字能源 KaiwuDB

Java 内联类初探

三十而立

Java

谁能让企业运营快速提效,那当然瓴羊Quick BI

巷子

深入了解 JavaScript 内存泄漏

京东科技开发者

JavaScript 前端 内存 计算

[译]探索 Go 中 io/fs 包以提高测试性能和可测试性

黑客不够黑

golang 测试 io/fs

如此丝滑的按钮交互效果

南城FE

css3 前端 设计 动画 交互

如何将营销模板以小程序的形式上架至App?

FinFish

小程序容器 小程序技术 营销模板

一种异步延迟队列的实现方式

京东科技开发者

架构 软件架构 企业号 3 月 PK 榜 延迟处理

深扒RocketMQ源码之后,我找出了RocketMQ消息重复消费的7种原因

程序员小毕

程序员 RocketMQ 后端 架构师 消息中间件

软件测试/测试开发丨接口协议之抓包分析 TCP 协议

测试人

软件测试 自动化测试 测试开发

瓴羊Quick BI,让企业运营提效的好工具

对不起该用户已成仙‖

智能健康管理正当时,脉冲技术的一次自证与他证

脑极体

skg 按摩仪

朴素系统优化思维的实践

京东科技开发者

方案 构架 系统优化

如何防止订单重复支付?

采菊东篱下

Java 编程

无处不在的边缘网络感知

阿里云视频云

云计算 边缘云 边缘网络

物联网(IOT)时代的流处理和消息系统_语言 & 开发_Ben Lorica_InfoQ精选文章