【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

SQL 借助于 NewSQL 开始回归

  • 2013-12-14
  • 本文字数:1411 字

    阅读完需:约 5 分钟

新一轮的数据库开发风潮展现出了向 SQL 回归的趋势,只不过这种趋势并非是在更大、更好的硬件上(甚至不是在分片的架构上)运行传统的关系型存储,而是通过 NewSQL 解决方案来实现。

在市场被 NoSQL(一开始叫做“No more SQL”,后来改为“Not only SQL”)逐步蚕食后,近一段时间以来传统的 SQL 开始回归。其中广为传颂的一个解决方案就是分片,不过对于某些情况来说这还远远不够。因此,人们推出了新的方式,有些方式结合了 SQL 与 NoSQL 这两种技术,还有些方式是通过改进关系型存储的性能与可伸缩性来实现,人们将这些方式称作 NewSQL。Google(NoSQL 最初的支持者之一)构建了 F1,这是一个分布式的关系型数据库,将 BigTable 的高可用性与可伸缩性与 SQL 的“一致性和可用性”结合起来。Google 在白皮书 F1: A Distributed SQL Database That Scales (PDF)中是这样介绍 F1 的:

这是由 Google 构建的一个容错、分布式的 OLTP 与 OLAP 数据库,作为新的存储系统用在 Google 的 AdWords 系统上。设计它的目标旨在替换掉分片的 MySQL 实现,因为后者已经无法满足日益增长的可伸缩性与可靠性的需求了。

MemSQL 就是众多的 NewSQL 解决方案中的一个,这是个完全的内存解决方案,用于对结构化与半结构化(JSON)数据进行实时分析。它并没有使用列式存储,而是使用了“无锁的 skip 列表与无锁的 hash tables”以实现更快的数据访问,并且对非分片架构使用了并行处理,不会出现单点失败的情况。

另一个 NewSQL 解决方案是 ClustrixDB ,这是个点对点的非分片的分布式数据库,用于事务处理与实时分析。根据 Clustrix CEO Robin Purohit 所述,他们的数据库在 Twoo.com 每天能够处理 4.4B 个事务,21 个节点(每个节点的配置是 8 核,48GB 内存)的平均延迟为 5 到 10 毫秒,其构建方式是这样的:

从头开始构建的点对点分布式 SQL 数据库,没有单独的协调者(因此就不会出现单个的失败点)。ClustrixDB 使用了分布式事务,事务使用了 Paxos 的一致性协议。ClustrixDB 针对写使用了 2 阶段锁,还使用了分布式的多版本并发控制,用于确保读与写不会互相干扰。这可以保证分布式环境下单个节点数据库严格的 ACID 属性。 ClustrixDB 并没有使用分片架构,这种方式也是唯一一种可以实现线性伸缩的架构。ClustrixDB 将原来只有数据仓库中才拥有的用于实时分析的 Massively Parallel Processing (MPP)带到了主流数据库上。

我们也向 Twoo.com 的 CEO Toon Coppens 提出了这样一个问题:为何最初的 MySQL 分片解决方案无法满足他们的要求,转而去选择一个 NewSQL 呢:

我们花了一些时间了解 Netlog.com 的架构,他们拥有成百个 MySQL 分片,重新平衡与管理这些分片的代价是非常高昂的,更不必说即时修改查询或是在所有分片上创建新查询时的不灵活性了,这种方式并不可取。我们希望一个查询就能将数据查出来。 虽然 NoSQL 提供了不错的可伸缩性,但我们并不想将自己绑定在底层的数据表示上。我们希望在修改产品与特性需求时拥有完全的灵活性,同时又不必修改每天都在变化的网站的数据层(clustrix 提供了快速的变化,同时又能在高负载下运行良好,当然了,它还有其他很多优秀的特性)。

虽然 NoSQL 因其性能、可伸缩性与可用性而广受赞誉,但其开发与数据重构的工作量要大于 SQL 存储。因此,有些人开始转向了 NewSQL,它将 NoSQL 的优势与 SQL 的能力结合了起来。最为重要的是使用能够满足需要的解决方案。

查看英文原文: SQL Makes a Comeback through NewSQL

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2013-12-14 03:306763
用户头像

发布了 88 篇内容, 共 258.7 次阅读, 收获喜欢 8 次。

关注

评论

发布
暂无评论
发现更多内容

云原生数据库下一站:像 MySQL 一样流行,让更多人受益于新技术的发展

百度Geek说

云计算 云原生数据库

AI投研分析,模块化赛道可能会出现新的头部公链

股市老人

揭秘Linux进程通讯:解决死锁难题的方法论

测吧(北京)科技有限公司

测试

深度探索名企项目开发:揭秘经典开发流程与测试策略

测吧(北京)科技有限公司

测试

企业架构设计原则之品质均衡性(一)

凌晞

企业架构 架构设计 架构设计原则

精通测试规划:打造完备的测试计划与总结报告

测吧(北京)科技有限公司

测试

高效管理测试资源:工具化管理测试用例与Bug漏洞

测吧(北京)科技有限公司

测试

Linux IO:打开数据之窗的魔法

GousterCloud

io Linux Kenel

我们是如何测试人工智能的(五)案例介绍:ASR 效果测试介绍

测吧(北京)科技有限公司

测试

我们是如何测试人工智能的(八)包含大模型的企业级智能客服系统拆解与测试方法 – 大模型 RAG

测吧(北京)科技有限公司

测试

ChatGPT全方位解析:如何培养 AI 智能对话技能?

测吧(北京)科技有限公司

测试

AI投研分析,模块化赛道可能会出现新的头部公链

股市老人

Linux内核探幽:深入浅出IO模型

GousterCloud

io Linux Kenel

Centos安装openjdk11并配置JAVA_HOME

百度搜索:蓝易云

Linux centos 运维 Openjdk 云服务器

精通Linux性能优化:掌握CPU、内存、网络和IO性能调优的技巧与工具

测吧(北京)科技有限公司

测试

性能测试中的唯一标识问题研究

FunTester

测试管理实战:优化测试流程,提升项目质量与效率

测吧(北京)科技有限公司

测试

我们是如何测试人工智能的(七)包含大模型的企业级智能客服系统拆解与测试方法 – 知识引擎

测吧(北京)科技有限公司

测试

基于HIL+RCP的三相整流电路实验

智趣匠

电压 电源 三相整流

Linux IO的奥秘:深入探索数据流动的魔法

GousterCloud

io Linux Kenel

Linux文件管理知识:查找文件

百度搜索:蓝易云

云计算 Linux 运维 云服务器 ECS

Mistral Large模型现已在Amazon Bedrock上正式可用

财见

探秘Linux进程与线程:多进程与多线程的奥秘及实战场景

测吧(北京)科技有限公司

测试

ERC314协议代币开发及合约开发详解

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

解析名企测试流程:从项目立项到产品上线的完整指南

测吧(北京)科技有限公司

测试

C++ Break、Continue 和 数组操作详解

小万哥

程序人生 编程语言 软件工程 C/C++ 后端开发

零信任安全模型:构建未来数字世界的安全基石

GousterCloud

零信任

我们是如何测试人工智能的(六)推荐系统拆解

测吧(北京)科技有限公司

测试

淘宝商品评论API:连接消费者与商家的桥梁,提升购物体验新途径

技术冰糖葫芦

API 文档

Rust 解码 Protobuf 数据比 Go 慢五倍?记一次性能调优之旅

Greptime 格睿科技

Go rust 性能 序列化 企业号 4 月 PK 榜

从零开始编写的下一代逻辑编排引擎 NopTaskFlow

canonical

低代码 工作流引擎 逻辑编排 协程原理 行为树

SQL借助于NewSQL开始回归_DevOps & 平台工程_Abel Avram_InfoQ精选文章