阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

Tokutek 发布新版本的 TokuDB 和 TokuMX

  • 2014-11-07
  • 本文字数:1105 字

    阅读完需:约 4 分钟

Tokutek 已经发布了其存储引擎产品的新版本。 TokuDB for MySQL 已经到了 7.5 版本,包含两项重要的性能特性。 TokuMX for MongoDB 已经到了 2.0 版本,包含各种新特性,其中包括其本身性能的提升。

对于简单的 select,TokuDB 先前的版本已经支持行的批量获取。 Rich Prohaska 是 Tokutek 的一名工程师,他解释了这样做的动机:

MySQL 使用 Handler API 从 TokuDB(和其它存储引擎)一次获取一行数据。遗憾的是,就每次 Handler 调用从分形树上获取下一行或上一行数据而言,分形树搜索过于复杂而难以使用。TokuDB 在 Handler 中使用了一个批量获取缓冲区,其中包含了一次分形树搜索的结果。当 MySQL 调用下一个或上一个 TokuDB Handler 而且批量获取缓冲区非空时,就从批量获取缓冲区中弹出一行返回给 MySQL。否则,用一次分形树搜索返回的多行结果填充批次获取缓冲区。

在 TokuDB 7.5 中,该特性经过了扩展,支持更复杂的 select 语句了,包括“INSERT [IGNORE] INTO … SELECT”、“INSERT INTO … ON DUPLICATE KEY UPDATE”、“REPLACE INTO … SELECT”和“CREATE TABLE … SELECT”。

除改进了批量获取特性外,TokuDB 7.5 还引入了执行读取无关复制的功能。Prohaska 是这样阐释该特性的:

当使用基于行的复制时,该行的映像会写入二进制日志,用于写入、删除和更新操作。从节点可以从二进制日志中使用该行映像,从而避免了从表中读取该行。这种读取无关复制的设计可以显著降低从节点的 I/O 负载。

Tokutek 做了一次基准测试,声称使用读取无关复制时性能提升了20 倍。不过,Tokutek 提醒说,在可以使用该项特性前需要首先满足一些条件

TokuMX 2.0 带来了自己的一套广受欢迎的改进。首先是将 Ark 一致性算法用于复制。Ark 算法由 Tokutek 创建,与 MongoDB 的默认算法相比,它可以提供更好的复制保障。尤其是,Ark 可以确保实现了 acknowledged 级别 majority write concern 的写操作将永远不会因为随后的故障回滚。

除了 Ark 算法,TokuMX 2.0 还增加了其它两项重要特性。第一项是,分区集合增加了分片支持。分区集合考虑了数据的范围删除,这在对时间序列数据做时效处理时尤其重要。第二项是,TokuMX 现在支持 MongoDB 2.4 的所有地理索引和查询特性。

最后,TokuMX 2.0 增加了快速更新支持。Tokutek 声称,这带来了10 倍的性能提升。在TokuMX 先前的版本中,更新会执行一个查询读取现有文档,然后更改相关索引。借助快速更新,如果更新没有更改任何索引字段,那么开始时的查询就可以完全避免。

TokuDB 和 TokuMX 基于 Tokutek 的分形树索引技术。TokuDB 遵循GPLv2 许可协议,TokuMX 遵循AGPL 许可协议。

查看英文原文:**** Tokutek Releases New Versions of TokuDB and TokuMX

2014-11-07 02:053181
用户头像

发布了 1008 篇内容, 共 421.3 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

一文详解新一代高效前端构建工具VITE-达观数据

NLP资深玩家

vite 前端构建 es modules

华为云云原生数据库,让企业离应用更进一步

新消费日报

Buck电路的原理及器件选型指南

元器件秋姐

电路 元器件 PCB设计 电源 Buck

技术分享 | 如何利用GPU云服务器加速AIGC训练

阿里云弹性计算

云计算 阿里云 大模型 AIGC

C++ 测试框架 GoogleTest 初学者入门篇

不在线第一只蜗牛

编程 测试框架 C++

新华网专访 | 用友网络:中国企业“出海”要有全球视野 需构建数智化全球人才供应链

用友BIP

人力资源 中企出海

24款好用的电脑画图软件推荐,总有一款适合你!

彭宏豪95

效率工具 软件 流程图 画图软件 绘图工具

ZipZapAI大模型与勇者斗恶龙:探索AVG游戏的无限可能

Ricky

AI Chat ChatGPT

点云标注的标准化与数据共享

数据堂

秒验丨 REST API:手机号码置换接口

MobTech袤博科技

大数据 前端 后端

点云标注的算法优化与性能提升

数据堂

华为云MetaStudio全新升级,盘古数字人大模型助力数字人自由

华为云开发者联盟

人工智能 华为云 数字人 华为云开发者联盟 企业号 7 月 PK 榜

以开放安全底座赋能全球开发者,华为云构筑云原生安全防护体系

华为云开发者联盟

云计算 华为云 华为云开发者联盟 企业号 7 月 PK 榜

语音标注平台:推动语音技术发展的关键支撑

数据堂

区块链技术协议有哪些?

TiAmo

区块链 技术协议

点云标注与自动驾驶的安全性

数据堂

ScaleBit 与 NFTScan 达成安全生态合作伙伴关系

NFT Research

安全 NFT\

DPO 直接偏好优化:跳过复杂的对抗学习,语言模型本来就会奖励算法

Zilliz

AIGC LLM RLHF

问答对话文本数据:解锁智能问答的未来

数据堂

超高速稳定!香港虚拟主机助你网站飞一般的速度!

一只扑棱蛾子

香港虚拟主机

数据孤岛、系统林立,这些顽疾瓴羊想要全搞定

ToB行业头条

如何评价MyBatis-Flex框架

酱紫的小白兔

Python源码剖析:深度探索Cpython对象-达观数据

NLP资深玩家

Python CPython 达观数据

低代码的出现,程序员要拒绝还是拥抱

互联网工科生

软件开发 低代码 JNPF

HiveSQL 迁移 FlinkSQL 在快手的实践

Apache Flink

大数据 flink 实时计算

不要爱上解决方案,而是爱上问题!什么是设计思维

汽车之家客户端前端团队

前端 设计思维 学会思考 ChatGPT

HDC精彩回顾|7月8日OpenTiny重磅发布

OpenTiny社区

开源 前端 UI组件库

模块七:王者荣耀商城异地多活设计

家有两宝

架构训练营

Tokutek发布新版本的TokuDB和TokuMX_数据库_Benjamin Darfler_InfoQ精选文章