2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Google 发布面向 App Engine 的 High Replication Datastore

  • 2011-01-15
  • 本文字数:1162 字

    阅读完需:约 4 分钟

分布式、可伸缩及高可靠的数据存储将成为业界的下一个圣杯。在发布 Google App Engine Datastore 两年后,Google 开始直面这个问题。其 Master/Slave 复制架构的设计意图在于支持“快速、一致的读需求”,同时还支持快速的写需求。但 Google 需要重新审视这个问题

你可能注意到了,我们过去半年一直在与 App Engine Datastore 的某些可靠性问题进行着斗争。在过去的几个月中,我们取得了长足的进步。然而,解决这些问题所积累的经验使我们认识到需要重新考虑一下设计假定了。

上周,Google 发布了“High Replication Datastore”以为读和写提供更高层次的可用性。但这也是有代价的,那就是增加了写延迟,同时 API 中的一致性保证也发生了变化。

High Replication Datastore 使用 Paxos 算法来实时同步跨越多个数据中心的数据,进而增加了用于维护数据复制的数据中心数量。这么做最大的好处在于计划的维护周期内,应用的所有功能都保持完全的可用性,对于大多数意外的基础设施问题也一样。

Google 警告开发者:

由于是分布式数据库,正如 CAP(Consistency,一致性;Availability,可用性;Partition tolerance,分区容错性)所示,开发者需要非常小心地对应用进行架构,因为随着成本的增加、可靠性的增强以及复杂性的增加,性能不可避免地会降低。

为了帮助开发者将现有的应用数据迁移到 High Replication Datastore 上,Google 提供了一些迁移工具。由于复制量的增加,Google 还将价格提高了 1/3。

Todd Hoff 称之为“向完全的分布式未来迈进的一大步”

HRD 的目标是需要将数据复制到至少 3 个数据中心的、需要完整的 ACID 语义、高一致性保证的任务关键性应用。

Google 新的数据存储定义了一种介于 RDBMS 抽象元组和 NoSQL 具体的行列存储之间的一种数据模型。在 RDBMS 中,数据模型声明在 Schema 中并且是强类型的。每个 Schema 都有一个表集合,每张表包含一个实体集合,每个实体包含了一个属性集合。属性具有名称,其值具有相应的类型。

Bigtable 可以在相同的行 / 列对中存储多个值,只不过时间戳不同。该特性实现了多版本并发控制(MVCC):当使用了事务时,在写入值时需要带上其事务的时间戳。在读取时会使用上一次事务的完整时间戳以避免部分更新的情况出现。

平均的读延迟在 10 毫秒左右,具体时间取决于数据量,这表明大部分读都是本地的;平均的写延迟在 100——400 毫秒左右,具体时间取决于数据中心之间的距离、写入的数据大小以及完整复制的数量等因素。

曾经只被大公司用于构建任务关键性应用的“大基础设施”现在也充分利用了长尾理论,可以构建创新型应用了,这在几年前是无法想象的事情。你打算使用 Google App Engine 么?自己的解决方案中需要这样的数据存储么?这种基础设施给你带来的最大好处是什么呢?

查看英文原文: Google Releases the High Replication Datastore for App Engine

2011-01-15 22:163707
用户头像

发布了 88 篇内容, 共 272.5 次阅读, 收获喜欢 9 次。

关注

评论

发布
暂无评论
发现更多内容

小度赋能“苏超”推出智能体“i苏超”,AI重塑体育资讯与服务体验

科技大数据

YashanDB数据库在物流行业的智能调度系统应用研究

数据库砖家

跟上节奏!KWDB 核心贡献挑战赛培训再度发车!

KaiwuDB

数据库 直播

飞算 JavaAI 取消生成源码功能:灵活把控源码生成任务的实用指南

飞算JavaAI开发助手

Java 源码 AI 开发工具 后端开发

TinyEngine 2.8 正式上线:AI能力就位、Docker部署更高效!

华为云开发者联盟

AI 开发者 华为云 华为云开发者联盟

飞算JavaAI行间会话:企业级Java开发代码意图识别的“破局利刃”

飞算JavaAI开发助手

Java 后端开发 企业级开发 代码意图识别 行间会话

Coze教程 第3章:核心功能 | 智能体(Agent)创建与角色设计

测吧(北京)科技有限公司

YashanDB数据库在物联网数据处理中的应用潜力

数据库砖家

YashanDB数据库在政府公共数据管理中的应用

数据库砖家

YashanDB数据库在政府机构的数据治理应用

数据库砖家

AI技术在教学资源网中的应用

北京木奇移动技术有限公司

软件外包公司 AI技术应用 教学资源网

“人工智能+”再提速 | 狄耐克以人工智能为翼,赋能企业高质量发展新篇章

新消费日报

当Playwright遇见MCP,AI智能体实现自主化UI回归测试

测吧(北京)科技有限公司

从 “手动建目录” 到 “一键生成”:飞算 JavaAI 拯救企业级后台开发者

飞算JavaAI开发助手

Java 程序员 AI 一键生成

2025年AI编程四大神器:开启编程效率飙升的智能新纪元

飞算JavaAI开发助手

开发工具 2025 AI编程

以数生智,以智驭数:GenAI新常态下的企业数据之道 | 矩阵起源产品发布会重磅启幕

MatrixOrigin

应用案例丨拍张照片,就知道零件多少钱? 从7天到1小时:用视觉AI加速零件成本预测

Altair RapidMiner

人工智能 AI 数据分析 仿真 CAE

图书馆AI推荐新书的开发流程

北京木奇移动技术有限公司

软件外包公司 AI技术应用 AI图书馆

系统梳理 RAG 系统的 21 种分块策略

Baihai IDP

程序员 AI rag 检索增强生成 分块策略

践行“人工智能+”行动,和鲸携手北京中医药大学管理学院成功举办医工融合人才培养与实验室建设研讨会

ModelWhale

医工融合 北京中医药大学 人工智能+

gRPC不是银弹:为内网极致性能,如何设计自己的RPC协议?

poemyang

高并发 网络协议 RPC RPC架构

CST软件如何在同一个TS Block中导入多组S参数

思茂信息

cst 电磁仿真 cst仿真软件 CST Studio Suite

YashanDB数据库在云计算环境中的最佳实践

数据库砖家

飞算 JavaAI 删除源码任务功能:清爽管理任务队列的实用指南

飞算JavaAI开发助手

Java AI 后端开发 idea intellij

Claude Code干活终于会「出声」了!再也不用盯屏幕等完成

阿星AI工作室

AI 产品经理 大模型 AI编程 AI coding

YashanDB数据库在企业信息化建设中的作用

数据库砖家

YashanDB数据库在云计算环境中的应用与优化技巧

数据库砖家

微软安全更新指南新增“安全公告”标签,强化漏洞管理

qife122

微软安全 安全公告

YashanDB数据库在物流管理系统中的高效应用

数据库砖家

YashanDB数据库在医疗行业的数据管理应用实例分析

数据库砖家

Google发布面向App Engine的High Replication Datastore_架构_Jean-Jacques Dubray_InfoQ精选文章