东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式! 了解详情
写点什么

Christian Posta 谈如何处理微服务的数据

  • 2016-09-21
  • 本文字数:2209 字

    阅读完需:约 7 分钟

人们之所以会采用微服务架构,一个非常重要的原因就是这种架构允许不同的团队分工协作,各自推进,互不影响。那么怎样做才能实现微服务架构呢?最近 Red Hat 的首席中间件架构师、开源爱好者和 Apache 代码提交者 Christian Posta 在博客上发表了一篇文章分享了自己的看法,他认为单纯地使用 Spring Boot、Dropwizard 或者 Docker 并不意味着你已经走在了微服务的路上,要真正地实现微服务,必须要深入理解领域和数据。

对于数据,有人认为每一个微服务都应该拥有并控制自己的数据库,任意两个微服务都不应该共享同一个数据库,因为如果共享数据库就会有读、写竞争,数据模型冲突,协调难度大等问题;而统一的数据库则安全性更高,更便利,更容易理解和管理。那么在构建微服务的时候应该如何权衡、协调这些问题呢?Christian Posta 认为对于一个正在构建微服务架构的企业,首先应该搞清楚下面四个问题:

  • 领域是什么?实际情况是什么?
  • 事务的边界在哪里?
  • 微服务应该采用什么方式实现跨边界通信?
  • 如果把数据库拿出来会怎样?

Christian Posta 首先解释了什么是领域,他认为在构建微服务之前必须充分而深入的理解数据的含义、了解数据是如何产生与消费的。例如,如何给“书”下定义,如何用数据模型表示它:

书是带页码的东西?那报纸是书么(它也页码)?书有硬的封皮?书不是每天都出版?出版社可能会用一条记录表示某个作者的某本书,但是书店里面可能会有多本这样的书,如何表示这种关系呢?假如一本书太长必须分卷,应该如何处理?每一卷都是一本书,还是合到一起才算?

对于这种问题现实情况是没有万能的答案,关键是看“谁问的问题,上下文是什么”。不同的上下文对同一问题的理解可能不同,作为人类我们能很容易地理解“书”是什么,但是计算机不能,在构建软件和数据建模的时候必须使计算机对上下文清晰明了。为此领域驱动设计(DDD)能够帮助我们处理其中的复杂性,通过领域模型建立数据模型,然后在实体、值对象之间画出边界,这些边界或者边界里的组件可能就是最终的微服务。

在数据模型和边界确定之后就需要一些方式来协调不同模型使之保持数据的一致性,这就需要找出事务的边界在哪里。Christian Posta 认为事务边界是业务不可变性的最小原子单元。无论是通过数据库的 ACID 特性还是通过两阶段提交来实现原子性,都无所谓,关键是要让事务的边界尽可能地小。例如,针对下面几个用例:

“允许客户搜索航班”
“允许客户选择某个特定航班的座位”
“允许客户预定某个航班”

可能会有三个有边界的上下文:搜索、预定和售票。搜索负责显示特定路线的航班以及给定时间范围内的旅游活动日程。预定通过客户的姓名、地址、经常乘坐的航班、座位喜好以及支付信息等安排预定流程。售票负责实际的订票和出票。这一阶段需要识别出每一个上下文中的事务边界从而实施约束 / 不可变性,保证不同上下文内的事务互不影响;但是此时并不需要 100% 的、严格的数据一致性,因此不需要考虑跨边界上下文的原子事务。例如,对于上面的场景:

预定流程可能会调用 SeatAvailability 服务让它在飞机上预留一个座位。这个座位预留的操作可能会实现为一个单独的事务(比如保留座位 23A)并返回一个预留 ID 号。预定流程会关联该预留 ID 号并提交预定。无论是预留座位还是接受预定,它们各自都是一个单独的事务,可以独立处理,不需要借助于两阶段提交或者两阶段锁。

但是数据并不是孤立的,在某些情况下独立的事务需要组合到一起,那么微服务应该采用何种方式跨边界通信呢?Christian Posta 认为微服务的价值在于自治,在于每一个系统都能够独立的变化,为了在实现自治的同时又保证业务需求,“事件机制”是非常好的选择。事件是不可变的数据结构,它会及时捕获与某个动作相关的信息,并被广播到其他节点,其他节点会监听它们感兴趣的事件,并根据事件的数据做出决策(存储数据、更新数据等)。例如,对于上面预定机票的场景:

当客户发起预定的时候,预定上下文会发布一个类似于“NewBookingCreated”的事件,售票上下文会消费该事件并与后端的票务系统交互。

使用事件的优点是:它能够避免边界之间昂贵的、不可能的事务模型;系统的各个部分能够独立变化,互不影响;系统的每个部分可以自己决定数据的更新周期,数据的存储方式,以及数据模式等;系统的可伸缩性、容错性和扩展性更好。当然,这种方式也有一些缺点:用户必须花费更多的精力研究 CAP 理论,了解存储或者队列的实现技术;调试的复杂度更高,实施的难度更高等。

最后,对于“微服务的数据应该存储到一个数据库中还是存储到不同的数据库中”,Christian Posta 给出的答案是“没有具体的规则,这需要根据具体的场景进行权衡,标准是不要失去自治所带来的优点”。此外,Christian Posta 还给出了一种通过 Apache Samza 构建事件流处理系统的思路,他认为这样做可以带来更多的好处:

  • 可以将数据库看作是“当前状态”的记录,而不是真正的记录
  • 可以引入新的应用程序,重新读取过去的事件并依据“已经发生的事情”检查它们的行为
  • 可以自由地审计日志
  • 可以引入新版本的应用,并通过回放事件对其进行非常完善的测试
  • 可以非常容易地修改数据库的版本和模式,执行升级,只需要将事件在新数据库中重放即可
  • 可以非常容易地迁移到全新的、不同类型的数据库

感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-09-21 19:001812
用户头像

发布了 321 篇内容, 共 115.9 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

什么是BOM?与焊盘不匹配,怎么办?

华秋电子

Outcome VS. Output:研发效能提升中,谁会更胜一筹?

LigaAI

敏捷开发 研发管理 技术管理 产品管理 企业号 2 月 PK 榜

高并发下保证接口幂等的8个锦囊

采菊东篱下

Java 编程

应用部署初探:6个保障安全的最佳实践

SEAL安全

应用部署 企业号 2 月 PK 榜 安全部署

精选案例 |《金融电子化》:光大银行云原生背景下的运维监控体系建设

博睿数据

云原生 可观测性 智能运维 博睿数据 精选案例

优质的云管平台厂商重点推荐-行云管家

行云管家

云计算 云管平台 行云管家

Selenium WebDriver API 学习笔记(二):浏览器控制

Python 自动化测试 selenium

组装式专家洞察|中国移动初瑞:基于智慧中台的“组装式”探索实践

信通院IOMM数字化转型团队

组装式应用 组装式创新 IOMM

Python读execl之xlrd库函数详解二:单元格相关

Python Excel 数据读取

SVFormer:走进半监督动作识别的视觉 Transformer

Zilliz

计算机视觉 Transformer

腾讯云助力东宁智慧农业发展,共探乡村振兴产业数字化创新

科技热闻

普通单双面板的生产工艺流程:图形转移

华秋电子

Python读execl之xlrd库函数详解三:行、列相关

Python Excel 数据读取

Serverless Streaming:毫秒级流式大文件处理探秘

华为云开发者联盟

云计算 大数据 华为云 企业号 2 月 PK 榜 华为云开发者联盟

火山引擎入选《2022爱分析 · DataOps厂商全景报告》,旗下DataLeap产品能力获认可

字节跳动数据平台

大数据 云服务 数据产品

WebUI自动化环境搭建

Python 自动化测试 selenium

Selenium WebDriver API 学习笔记(三):浏览器控制

Python 自动化测试 selenium

这才是打开Java面试的正确方式,金三银四互联网大厂Java面试八股来袭

架构师之道

编程 程序员 java面试

借助 APISIX Ingress,实现与注册中心的无缝集成

API7.ai 技术团队

服务注册与发现 服务发现 APISIX Ingress Controller

Java高手速成 | 图说重定向与转发

TiAmo

Java 重定向

成都市信息安全等级保护测评机构详细名单汇总

行云管家

成都 等保 等级保护 等保测评

中国一级市场5年完成1039个投融资事件;红杉中国、启明创投、高瓴创投在2022年最为活跃-创业邦发布《2022年合成生物学产业投资报告》

创业邦

压电石英晶体谐振器,国产替代需求强劲

华秋电子

世界上最健康的程序员作息表!「值得一看」

王中阳Go

golang 高效工作 学习方法 程序员 作息时间

从“服务”,到“赋能”,日日顺再次定义供应链生态建设

联营汇聚

公司项目引入这种方式,开发应用又快又准

引迈信息

项目管理 程序员 敏捷开发 低代码

Selenium WebDriver API 学习笔记(一):元素定位

Python 自动化测试 selenium

Python+Opencv解析一段视频并逐帧保存到本地

Python 数据读取 摄像头

Zebec完成BNB Chain以及Near链上协议部署,多链化进程加速

西柚子

小白指南:手把手教你用低代码开发一个应用页面

HarmonyOS开发者

HarmonyOS

详解 APISIX Lua 动态调试插件 inspect

API7.ai 技术团队

插件 api 网关 APISIX

Christian Posta谈如何处理微服务的数据_语言 & 开发_孙镜涛_InfoQ精选文章