写点什么

物联网 (IOT) 时代的流处理和消息系统

  • 2016-06-26
  • 本文字数:1409 字

    阅读完需:约 5 分钟

本篇是 O’Reilly Data Show 的一个采访实录,大数据公司 MapR 联合创始人、Uber 首席架构师 M.C. Srivas 讲述 IOT 时代的流处理和消息系统 。主持人和 Srivas 讨论了他在数据管理和开发分布式系统的经验。在 Srivas 的职业生涯中,他负责的友分布式系统、数据库、查询引擎、消息系统等。

Srivas 指出,上述系统广泛的部署在企业中,这些企业要求系统具有安全、容灾和支持多数据中心的功能。主持人和 Srivas 聊了很多主题,这里重点聚焦在实时系统和应用上。下面是谈话的一些亮点:

运行在多数据中心的应用和系统

广告服务需要在 70 到 80 毫秒限制内返回给广告商。当你点击一个页面,广告栏、侧边栏和底部的广告不得不在 80 毫秒返回结果。客户的数据中心遍布世界各地,日本、中国、新加坡、香港、印度、俄国、德国等。他们把各数据中心的数据发送到主数据中心来进行整个点击数据的处理,然后返回给用户。

他们需要一种清晰的方法让这些点击数据返回主数据中心,主数据中心可能运行在美国、日本或者德国,或者其他地方。一般情况下会在每个地方通过完全独立的 Kafka 集群实现,但有时会出现跨集群生产者和消费者不协调。比如,在日本数据中心有一个 Kafka 集群在运行,但在香港的 Kafka 集群不能进行故障切换。因为香港的 Kafka 集群是完全独立的,它并不能监测到日本数据中心的什么数据被消费了和什么数据产生了。如果消费者在日本的 Kafka 集群消费数据并迁移到香港的 Kafka 集群,他们会变成脏数据。许多客户在咨询这方面问题的解决方法。

数据源现在不是发送到几个数据中心,而是百万个数据中心。想象一下自动驾驶汽车,每个自动驾驶汽车好比一个数据中心,它生成很多数据。再看一下飞机,它也是一个大的数据中心,这些都是我们需要为规模化 IOT 所需要做的。

物联网时代的流处理和消息系统

一个文件系统是庞大的,你写入文件,读取文件,文件系统是怎样获取到你感兴趣的文件?如果我查看一个流处理系统,我正在查询的是一个完全实时的。如果一个发布者发布了一些数据,所有在相同数据中心的相关监听者需要在五毫秒钟获取通知。如果我们的数据中心跨越半个地球,你在日本数据中心发布数据,那南非或者其他地方的数据中心要在一秒之后才能获取到信息。

我们学习 Kafka、Tibco、RabbitMQ 等技术,也学习了很多监听数据的知识,来解决流处理和消息系统的问题。这是物联网 IOT 时代所需要的。

世界范围内最大的生物识别系统

我们完成生物识别系统 Aadhaar ,它能关联你的银行账户、医院就诊以及其他所有的数据记录——比如,学校入学、航空安检、护照等。现在大约有十亿人已具有这种生物识别,还有 300 万即将完成。如果你想从 ATM 机中取钱,你只要刷指纹即可取钱,而不需要一张银行卡。

Strata San Jose 2016 session: “ Real-time Hadoop: What an ideal messaging system should bring to Hadoop ” (featuring Ted Dunning of MapR)
Strata San Jose 2016 session: “ When one data center is not enough: Building large-scale stream infrastructure across multiple data centers with Apache Kafka
Architecting the World’s Largest Biometric Identity System
Srivas was on a panel on Stream Processing Systems that I moderated in early January .

译者介绍

侠天,专注于大数据、机器学习和数学相关的内容,并有个人公众号:bigdata_ny 分享相关技术文章。

查看英文原文: Stream processing and messaging systems for the IoT age

2016-06-26 17:005240
用户头像

发布了 43 篇内容, 共 30.7 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试 | 测试开发 | Jenkins 踩坑(三)| Email 配置与任务邮件发送

测吧(北京)科技有限公司

测试

微信Windows端IM消息数据库的优化实践:查询慢、体积大、文件损坏等

JackJiang

sqlite 微信 网络编程 即时通讯 IM

小六六学Netty系列之Java NIO(二)

自然

Netty 网络 9月月更

软件测试 | 测试开发 | 数据持久化技术(Java)

测吧(北京)科技有限公司

测试

「工作小记」多个批量操作的链式实现

叶一一

前端 设计思维 React Hooks 9月月更

FreeRTOS记录(二、FreeRTOS任务API认识和源码简析)

矜辰所致

源码分析 FreeRTOS 9月月更 任务API

SAP UI5 ManagedObject 的 Association 讲解

汪子熙

JavaScript typescript SAP UI5 ui5 9月月更

易周金融分析 | 多家银行试水特色网点揽客;自动驾驶颠覆传统车险模式

易观分析

自动驾驶 金融 银行 网点

阿里云弹性计算技术专家樊毅伟:云上成本优化实践

阿里云弹性计算

自动化运维 资源利用

蒙特卡洛方法与蒙特卡洛搜索树(一)

Joshua

机器学习 算法 蒙特卡洛

i++需要多少QPS才能测出BUG

FunTester

OpenHarmony中的HDF单链表及其迭代器

OpenHarmony开发者

Open Harmony

小六六学Netty系列之Netty群聊

自然

Netty 网络 9月月更

如何使用Postman调试HMS Core推送接口?

HarmonyOS SDK

移动推送

C语言_2 变量

泾箐

c 9月月更

长沙!《学习的学问》长沙分享会

博文视点Broadview

找准风口,如何从运维转向 DevOps?

飞算JavaAI开发助手

软件测试 | 测试开发 | 如何模拟真实使用场景?mock 技术来帮你

测吧(北京)科技有限公司

测试

「趣学前端」骨架屏,分享一波前端UI组件开发的经验

叶一一

JavaScript 前端 组件 9月月更

数据治理的内核:数据标准

小鲸数据

数据治理 大数据平台 数据管理平台 数据标准 大数据仓库

行业案例|长安汽车质量管理数据分析实践

Kyligence

质量管理 数据管理 长安汽车

主流定时任务解决方案全横评

阿里巴巴云原生

阿里云 Serverless 云原生

C语言_3 选择结构

泾箐

c 9月月更

源于加速,不止加速-阿里云加速引擎的10年演化之路

阿里云CloudImagine

CDN CDN加速 CDN技术

软件测试 | 测试开发 | 一文带你了解K8S 容器编排(上)

测吧(北京)科技有限公司

测试

云游戏产业链深度解析

Finovy Cloud

云计算 5G 云渲染 云游戏

Netty高并发处理架构设计介绍

孙大卫

架构 Netty 开发框架 9月月更

中文稀疏GPT大模型落地——通往低成本&高性能多任务通用自然语言理解的关键里程碑

阿里云大数据AI技术

自然语言处理 多任务 企业号九月金秋榜 GPT

软件测试 | 测试开发 | 想测试入门就必须要懂的软件开发流程

测吧(北京)科技有限公司

测试

小六六学Netty系列之Java 零拷贝

自然

Netty 网络 9月月更

TOP 5!望繁信科技获评WAIC2022全球创新项目路演优胜项目

望繁信科技

WAIC2022

物联网(IOT)时代的流处理和消息系统_语言 & 开发_Ben Lorica_InfoQ精选文章