NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

物联网 (IOT) 时代的流处理和消息系统

  • 2016-06-26
  • 本文字数:1409 字

    阅读完需:约 5 分钟

本篇是 O’Reilly Data Show 的一个采访实录,大数据公司 MapR 联合创始人、Uber 首席架构师 M.C. Srivas 讲述 IOT 时代的流处理和消息系统 。主持人和 Srivas 讨论了他在数据管理和开发分布式系统的经验。在 Srivas 的职业生涯中,他负责的友分布式系统、数据库、查询引擎、消息系统等。

Srivas 指出,上述系统广泛的部署在企业中,这些企业要求系统具有安全、容灾和支持多数据中心的功能。主持人和 Srivas 聊了很多主题,这里重点聚焦在实时系统和应用上。下面是谈话的一些亮点:

运行在多数据中心的应用和系统

广告服务需要在 70 到 80 毫秒限制内返回给广告商。当你点击一个页面,广告栏、侧边栏和底部的广告不得不在 80 毫秒返回结果。客户的数据中心遍布世界各地,日本、中国、新加坡、香港、印度、俄国、德国等。他们把各数据中心的数据发送到主数据中心来进行整个点击数据的处理,然后返回给用户。

他们需要一种清晰的方法让这些点击数据返回主数据中心,主数据中心可能运行在美国、日本或者德国,或者其他地方。一般情况下会在每个地方通过完全独立的 Kafka 集群实现,但有时会出现跨集群生产者和消费者不协调。比如,在日本数据中心有一个 Kafka 集群在运行,但在香港的 Kafka 集群不能进行故障切换。因为香港的 Kafka 集群是完全独立的,它并不能监测到日本数据中心的什么数据被消费了和什么数据产生了。如果消费者在日本的 Kafka 集群消费数据并迁移到香港的 Kafka 集群,他们会变成脏数据。许多客户在咨询这方面问题的解决方法。

数据源现在不是发送到几个数据中心,而是百万个数据中心。想象一下自动驾驶汽车,每个自动驾驶汽车好比一个数据中心,它生成很多数据。再看一下飞机,它也是一个大的数据中心,这些都是我们需要为规模化 IOT 所需要做的。

物联网时代的流处理和消息系统

一个文件系统是庞大的,你写入文件,读取文件,文件系统是怎样获取到你感兴趣的文件?如果我查看一个流处理系统,我正在查询的是一个完全实时的。如果一个发布者发布了一些数据,所有在相同数据中心的相关监听者需要在五毫秒钟获取通知。如果我们的数据中心跨越半个地球,你在日本数据中心发布数据,那南非或者其他地方的数据中心要在一秒之后才能获取到信息。

我们学习 Kafka、Tibco、RabbitMQ 等技术,也学习了很多监听数据的知识,来解决流处理和消息系统的问题。这是物联网 IOT 时代所需要的。

世界范围内最大的生物识别系统

我们完成生物识别系统 Aadhaar ,它能关联你的银行账户、医院就诊以及其他所有的数据记录——比如,学校入学、航空安检、护照等。现在大约有十亿人已具有这种生物识别,还有 300 万即将完成。如果你想从 ATM 机中取钱,你只要刷指纹即可取钱,而不需要一张银行卡。

Strata San Jose 2016 session: “ Real-time Hadoop: What an ideal messaging system should bring to Hadoop ” (featuring Ted Dunning of MapR)
Strata San Jose 2016 session: “ When one data center is not enough: Building large-scale stream infrastructure across multiple data centers with Apache Kafka
Architecting the World’s Largest Biometric Identity System
Srivas was on a panel on Stream Processing Systems that I moderated in early January .

译者介绍

侠天,专注于大数据、机器学习和数学相关的内容,并有个人公众号:bigdata_ny 分享相关技术文章。

查看英文原文: Stream processing and messaging systems for the IoT age

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2016-06-26 17:004664
用户头像

发布了 43 篇内容, 共 27.7 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

服务线上治理

阿泽🧸

微服务 7月月更

【算法社区】训练准备和复杂度分析

小明Java问道之路

数据结构 算法 LeetCode 7月月更 算法社区

leetcode 72. Edit Distance 编辑距离(中等)

okokabcd

LeetCode 动态规划 算法与数据结构

可观测|时序数据降采样在Prometheus实践复盘

阿里巴巴云原生

阿里云 云原生 Prometheus 可观测

图解网络:什么是网关负载均衡协议GLBP?

wljslmz

网络协议 7月月更 GLBP 图解网络 网关负载均衡协议

【Docker 那些事儿】容器为什么傲娇?全靠Hub撑腰

Albert Edison

7月月更

C语言中sizeof操作符的坑

Albert Edison

c++ C语言 7月月更 sizeof

Java实现单例模式

lambochen

单例模式

能源势动:电力行业的碳中和该如何实现?

脑极体

玩转gRPC—深入概念与原理

海风极客

gRPC 网络协议 后端开发

质量体系建设之路的分分合合

声网

创业讲堂 生态专栏

OpenHarmony资源管理详解

坚果

HarmonyOS OpenHarmony 6月月更

TLA+ 入门教程(1):形式化方法简介

多颗糖

分布式系统 TLA+

繁华落尽、物是人非:个人站长该何去何从

石头IT视角

HPDC智能基座人才发展峰会随笔

乌龟哥哥

7月月更

后CentOS时代的操作系统漫谈

冯骐

centos 开源 openEuler 国产化 Anolis

算法入门很简单:链表题套路及精选题目

宇宙之一粟

链表 7月月更

Vuex(三)

小恺

7月日更

蓝队攻防演练中的三段作战

穿过生命散发芬芳

攻防演练 7月月更

浅聊一下中间件

为自己带盐

中间件 7月月更 dotnetcore

Qemu Linux

贾献华

7月日更 7月月更

牛客java选择题每日打卡Day6

京与旧铺

7月月更

关于栈区、堆区、全局区、文字常量区、程序代码区

NewBoy

前端 移动端 iOS 知识体系 7月月更

跨域请求

Jason199

跨域 7月月更

【愚公系列】2022年7月 Go教学课程 003-IDE的安装和基本使用

愚公搬代码

7月月更

认识ThreadPoolExecutor

zarmnosaj

7月月更

什么是数据治理?为何华为愿意200万年薪聘数据治理专家?

雨果

数据治理 DaaS数据即服务

如何用一个插件解决 Serverless 灰度发布难题?

阿里巴巴云原生

阿里云 Serverless 云原生 插件 灰度发布

使用 BlocConsumer 同时构建响应式组件和监听状态

岛上码农

flutter ios 安卓 移动端开发 7月月更

HUAWEI nova 10系列发布 华为应用市场筑牢应用安全防火墙

最新动态

2022-Java后端工程师面试指南-(Java基础篇)

自然

Java’ 7月月更

物联网(IOT)时代的流处理和消息系统_语言 & 开发_Ben Lorica_InfoQ精选文章