使用2-3法则设计分布式数据访问层_语言 & 开发_卫向军

【编者按】《博文共赏》是 InfoQ 中文站新推出的一个专栏，精选来自国内外技术社区和个人博客上的技术文章，让更多的读者朋友受益，本栏目转载的内容都经过原作者授权。文章推荐可以发送邮件到 editors@cn.infoq.com 。

引言

如今移动互联网行业呈爆发式发展，随着业务用户规模和业务逻辑趋向复杂，后端系统的开发和维护变得越来越困难，目前业界涌现出各种各样的技术文章介绍分布式缓存设计、分布式数据库设计、负载均衡、HA 策略等等，这些都是支撑分布式数据访问层的基石，不过，本文将从另一个角度探讨分布式数据访问层 (Data Access Layer) 的框架设计。

本文要介绍的是 2-3 法则（2 个维度，3 个原则）在分布式 DAL 框架设计中的指导作用，两者共同完成 DAL 层封装，主要分为两点：1）从水平与垂直维度正交分析业务系统设计；2）定义 3 条必须遵守的设计原则，最重要的是 DAL 层从水平维度抽象数据访问策略模型，即个 3 原则中的第 3 条。

本文最后一节，对分布式数据访问框架做了探讨，提出了两种实现思路。

分布式 DAL 解决的问题

在分布式系统中，每一台服务器都需要访问本地缓存、分布式 MC 缓存、分布式后台数据库，对于同一个业务模块，随着业务变复杂，需要定义越来越多的数据 Model，按照一定的规则存储在本地缓存、分布式缓存以及后台数据库中。

目前，业界的数据访问层定位于应用程序与持久化数据库之间，比如淘宝的 TDDL、IBatis Sharding 等，主要完成数据的分库分表、读写分离等，本文的数据存储涵盖缓存、数据库、文件系统，现有的数据库 DAL 中间件、Redis 客户端、MC 客户端将作为本文的水平维度的 Adaptor，主要解决的问题：

数据访问在水平数据存储维度的一致性问题。
快速增加数据 Model 的能力。
优雅、清晰、模块化的数据访问层代码。

两个维度抽象设计

对于上节的问题，下面列举了水平和垂直维度抽象思考的例子。

假设水平维度：

部分热数据存储在本地缓存，本文使用 EhCache。
部分热数据存储在前端缓存，本文使用 MC。
全量数据存储在数据库缓存，本文使用 MySQL。

假设垂直维度：

数据模型 FileMeta，需要同时存储在 LocalCache、Redis 和 MySQL 中。
数据模型 BlockMeta，需要存储在 LocalCache、MC 中。
数据模型 Context，需要存储在 MC、MySQL 中。

按照上面的分析，我们画出系统两个维度正交设计图，如下：

Composition 而不是 Inheritance

我们可以想到垂直维度定义 N = 3 个数据模型接口，水平维度定义 N = 3 个分层接口，但是水平维度和垂直维度是什么关系呢？

在本文的设计中，对问题做了进一步思考，水平维度的接口全部由垂直维度的数据模型接口组合（Composition）而成，完成所有业务只需要定义 N + M + 1 个接口，而不是 N * M + 1 个接口，多余的那个是 DAL 接口，完成数据访问层封装工作，第一节例子中的接口定义见下图：

设计原则

上节主要介绍了接口设计，这里说一下实现，数据模型类非常简单，只要 MC Client、TDDL、EhCache 在不同层完成相应接口实现，最重要的是 DAL 实现类，需要完成水平各个维度的策略存储，比如对一个 Model，顺序写入 MC 和 MySQL，根据业务实践经验，总结出 3 条设计原则：

每一个数据模型都有 CRUD 方法，即数据操作的增删改查，对于 MC 或者 LocalCache 来说，增加操作和修改操作可能是一致的，这种情况也必须严格定义 CRUD 方法。
DAL 层封装所有的数据访问，保证数据的一致性存储和可靠性，DAL 层的实现调用 ILocalCacheService、IMCService、IDAOService，根据不同数据模型的存储策略，分别去调用缓存和数据库服务，数据模型如果仅存在 MySQL 或者 MC，也需要在 DAL 层做封装，这样虽然对开发效率有一定影响，但是整体开发和维护成本降低很多。
DAL 实现抽象出一个 DALContext 和一个 Executor，对于不同的数据模型，配置出不同的 DALContext，比如顺序存储在 MC 和 MySQL 或者同步写入 MC 异步写入 MySQL，DAL 也需要负责出错处理、水平维度的容灾切换等。

分布式数据访问框架

对于互联网后端应用来说，最主要的功能就是处理数据，对 DAL 层的探索与优化是非常有价值的，基于本文提出的 2-3 法则，感兴趣的读者可以构建一个 DAL 开源项目，有两种思路。

第一种思路是：

定义数据模型以及存储配置策略规范，可以使用类似 protobuf 的规范。
根据业务定义的数据模型和存储配置策略，生成业务代码。
开发者在此基础上扩充完善业务代码。

第二种思路是：

定义数据模型以及存储配置策略规范，可以使用类似 protobuf 的规范。
开发 DAL 中间件（容器），根据业务定义的数据模型和存储配置策略，运行时完成所有的数据访问操作代理。

第一种相对容易，第二种比较复杂，读者可以自己选择其中一种。

本文首发于“微博平台架构”微信公众号，发布时有少量的文字润色和调整。

关于作者

卫向军（ @卫向军 _ 微博），毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。

感谢臧秀涛对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ）或者腾讯微博（ @InfoQ ）关注我们，并与我们的编辑和其他读者朋友交流。

发布

暂无评论

创作场景

使用 2-3 法则设计分布式数据访问层

引言

分布式 DAL 解决的问题

两个维度抽象设计

Composition 而不是 Inheritance

设计原则

分布式数据访问框架

关于作者

评论

drainer同步到tidb延迟问题记录

防止漏洞扫描之保护 tidb 10080 端口

2024升级版反向海淘代购系统：解锁全球购物新体验

如何平衡向量检索速度和精度？深度解读HNSW算法

开放可控的企业级大数据平台建设大揭秘

关于 tiup 在线源切换处理

【12 月 28 日·上海站】TiDB 社区活动走进哔哩哔哩：一起聊聊国产数据库替换下新的使用方式，一套 TiDB 简化技术栈 & 承载企业多业务架构难题！参会还能赢取超级可爱的 B 站周边哟！

如何做需求分析

新东方 x TiDB丨从 v1.0 到最新版，选择和升级 TiDB 的全面考量

TiDB数据库placement-rules使用指南

安能物流 All in TiDB 背后的故事与成果

VMware ESXi 8.0U3c 发布 - 领先的裸机 Hypervisor

商业化大前端在性能优化领域的探索与实践

喜报！华夏银行联合乘云数字获评 "中国信通院可观测性实践典型案例"

乡村振兴积分系统（源码+文档+部署+讲解）

案例分析"assertion failed"

TiDB 字符集原理和最佳实践

TiDB 集群 PD 组件免授权访问解决方案

VMware ESXi 7.0 U3r 发布 - 领先的裸机 Hypervisor

专有云 ABC Stack 推出生态网关，让专有硬件快速上云一个都不能少

创作场景

使用 2-3 法则设计分布式数据访问层

引言

分布式 DAL 解决的问题

两个维度抽象设计

Composition 而不是 Inheritance

设计原则

分布式数据访问框架

关于作者

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载