NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

中国自主的数据库评测,是如何开展的?

  • 2022-02-16
  • 本文字数:3140 字

    阅读完需:约 10 分钟

中国自主的数据库评测,是如何开展的?

据相关数据显示,仅在 2021 第四季度,数据库初创企业就募集了超过 22 亿美元的资金。而像 Snowflake 这样的企业,整体市值已经超过千亿美金。

 

资本的大量涌入,反映的是整个数据库市场的产品丰富度出现了极大的提升。但在企业层面,这却为架构师们带来了另一个困扰:数据库的选型和评测问题。

 

此前,较受认可的评测是由 TPC( Transaction Processing Performance Council,事务处理性能委员会)推出的 TPC-C 评测标准,而 TPC-C 也一度成为每个主流数据库都会尝试一下的评测。但 TPC-C 也有自身的问题,首先,它面向的是 OLTP 数据库,并不能满足所有场景的数据库测试。实际上,TPC 只给出了标准规范,特别场景需要厂商自行处理。另外,TPC 的审核人员人数很少,且全部在美国,沟通不便。从开销的角度讲,TPC-C 也较为昂贵,比如 Oracle 从 2010 年开始,就基本退出了 TPC-C 评测。

 

种种问题,使数据库评测处于一个事实上的空白领域。这也促使国内许多机构开始尝试进行数据库标准评测,信通院作为我国工业和信息化部直属事业单位,有推动我国 ICT 领域健康、快速发展的直接责任,因此从 2015 年开始推出各类数据库评测,在整个行业都产生了较大的影响力。

 

在评测不断开展和完善的过程中,InfoQ 受邀参加了 2021 第十三批第二场数据库评审,也和中国信通院云计算与大数据研究所高级业务主管马鹏玮聊了聊,希望能了解到更多关于信通院数据库评测设计和评审的信息。

信通院数据库评测整体概况

 

从统计数据来看,截至 2021 年 11 月底,信通院已经开展了 13 批产品能力评测,共计完成 58 家企业 93 次基础能力测试、35 次性能测试和 4 次稳定性测试,几乎覆盖国内所有主流数据库企业和产品,企业包括云服务厂商、传统数据库企业、互联网大厂、通信企业、学术机构、电信运营商等行业头部用户方。

 

据 InfoQ 了解,目前信通院数据库评测整体涵盖几个方向,从应用类型上可分为事务数据库和分析型数据库;从数据模型上可分为图数据库、文档数据库、键值型数据库和时序数据库;从产品部署形态上,也有关系型云数据库参与评测。针对同一款产品,信通院按照产品基础能力、产品性能和产品稳定性来划分评测维度,总体形成“中国信通院可信数据库评测评估体系”。

 

而每种类型数据库的测试包括功能、性能、安全性、稳定性四大项,涉及大概 20 - 30 个必选测试用例,以及 10 个左右的可选测试用例,整体设计参考了我国工信部发布的各类数据技术要求与测试方法标准文件。以分析型数据为例,其测试标准表如下:

 



为了保证评测过程的公正、科学,整个评测大致分为标准制定、报名审核、实地测试、专家评审 4 个环节。在标准制定环节,信通院会联合该领域内头部企业,共同制定测试标准;在报名审核环节,被测数据库企业提交相应信息到信通院进行审核,只有符合对应评测条件的数据库可以参与评测;在实地测试环节,信通院会根据被评测的产品类别,派出对应工程师到现场,按照前期制定的统一标准执行测试;在专家评审环节,信通院会邀请金融、电信领域的应用方专家,以及领域内头部高校专家,共同对测试结果进行评审,确保测评结果的正确性。

 

因为测试类别的不同,现场测试时间一般会在 3 天到 2 周之间浮动。测试过程中,信通院会有测试工程师全程参与,而被测方的产业负责人、测试人员等均会全程参与。虽然有部分企业反映测试时间紧张,但时间问题也是信通院技术专家的关注重点。在测试开始前,信通院专家会与企业一起讨论测评时间的设计。信通院的工程师也会在正式测试前,进行模拟和试验,验证时间的合理性。

 

这也说明该测试仍然是有相当难度的,采访中,马鹏玮表示:“只有执行资源不是完全充裕的任务,才能考验一个人的能力水平。如果测试时间每家企业都十分充裕,那估计每家企业都有充足的时间研究怎么去考满分,测评也就失去了意义。”

“全面”与“公平公正”,是评测的重点

 

此前的业内数据库评测,一般针对某一类数据库产品的某一项功能,或某个场景下的性能进行评测,作为行业参考可能是有失偏颇的。所以,信通院数据库评测在整体设计上,首要解决的是“全面评测”的问题。

 

反映在具体的测试方法上,就像前文提到的,一是涵盖的数据库类型全面;二是针对某一数据库产品,测试的维度全面。

 

“公平公正”则是打造评测标准体系的另一个要点。信通院是基于国家要求的测评质量流程执行测试,在前期会对测试人员的知识体系进行标准化培训。在测试环境和工具方面,信通院选择自建机房、自研测试工具,统一了软硬件环境,同时也消除了作弊的空间。相关工具也会提供给应用方长期使用,以保证测试公正透明。

 

而具体的测试标准和方法,则是由信通院和业内头部应用方和供应商(四大行、HBAT 等)共同讨论形成,讨论时间可长达半年以上。测试完成后,产业专家会对测试结果进行评审,保证结果真实可信。信通院也会将非敏感信息对外公开,接受整个产业的监督。

 

当然,从实际测试过程来看,专家评审结论一般与现场测试结果基本一致。于评审专家而言,更多的工作可能是在保证测试结果准确性的同时,也针对供应商的产品情况提出一些优化意见,帮助供应商更好的成长。

从测试结果看国产数据库发展情况

 

“全面”、“公平公正”的理念,无疑也得到了相当多企业的认可,在最近的一次数据库评测(第十三批评测)中,来自不同公司的八十余款数据库产品通过了基础能力评测,几乎覆盖了国产数据库的“半壁江山”。

 

针对测评的结果,我们也能看到一些有意思的现象。比如,中小企业参评的比重在增多,与资本市场的反馈互相验证;海量异构数据处理需求正在推动数据存储技术快速发展,比如,以图数据库、键值数据库为代表的新型数据存储产品较前几批测试有了较大的增长;各家数据库之间,产品能力的差异正逐渐扩大,可选项通过率低至 50.23%。

 

如果将国外数据产品也纳入考虑,这些趋势会更有意思。

 

马鹏玮分享道:

 

“从产品能力看,我国部分产品的功能、性能已经超越了国外数据库产品,有很多的数据、案例均说明了这一点。但是我们不能因为这些就说我们处于领先地位。因为国外数据库真正强大的地方在于其他方面。一是他们有非常完备的渠道体系,这就保证了他们可以用自己的力量或合作伙伴的力量,随时响应甲方的需求;二是他们有非常丰富的人才储备。因为数据库在部署后,还是需要人去运维的,甲方可以很容易的在市场上招到能运维国外数据库产品的人才,但是国产的就很难找。”

 

更隐晦的问题在于,数据库作为重要的基础软件,是存在相当的品牌价值差异的。比如,如果一名架构师在做规划时选用了 Oracle 数据库,但在实际使用过程中,Oracle 出现了问题,该架构师可能并不会特别难堪,因为他可以宣称自己使用了世界顶级的数据库,责任不在自己。但如果该架构师选择使用国产数据库,甚至是来自创业团队的新型数据库。那么一旦出现问题,压力可能会非常大。

 

当然,品牌价值会随着产品的完善而提升,新产品总会褪去青涩,这些标准化的测试,也正是在加速这一过程。同时,国产数据库正迎来史无前例的发展机会 —— 数据量爆炸式增长,数据存储结构灵活多样,新兴的业务需求催生数据库及其应用系统的存在形式愈发丰富,数据库技术不断向着模型拓展、架构解耦的方向演进,与云计算、人工智能、区块链、隐私计算、新型硬件等技术呈现取长补短、不断融合的发展态势。

 

马鹏玮将这种发展态势进一步细化为三个要点:

 

  1. 多模数据库实现一库多用、利用统一框架支撑混合负载处理、运用 AI 实现管理自治,提升易用性、降低使用成本;

  2. 充分利用新兴硬件、与云基础设施深度结合,增强功能、提升性能;

  3. 利用隐私计算技术助力安全能力提升、区块链数据库辅助数据存证溯源,提升数据可信与安全。

 

随着国产企业在以上各场景技术、业务经验的不断积累,相信整个国产数据库产业,也将随之进入新的发展阶段。

 

2022-02-16 19:263754

评论 2 条评论

发布
用户头像
如果一名架构师在做规划时选用了 Oracle 数据库,但在实际使用过程中,Oracle 出现了问题,该架构师可能并不会特别难堪,因为他可以宣称自己使用了世界顶级的数据库,责任不在自己。

我觉得开发人员可以这么说。架构时说不了,有设计目标吗
2022-02-18 12:08
回复
说得没错,这是个甩锅问题,但对于优秀的架构师来说,本不应该存在甩锅问题。
2022-02-20 11:27
回复
没有更多了
发现更多内容

一文详解Vue生命周期

EquatorCoco

Vue 生命周期

机智的告警策略,完善监控系统的重要一环

观测云

监控告警 告警策略

最新demo版 | 如何0-1开发支付宝小程序之小程序页面功能介绍(三)

盐焗代码虾

支付宝小程序 支付宝 小程序开发

外贸推广方式有哪些

九凌网络

直播预告丨大模型+Agents疏通京东金融运营堵点

京东科技开发者

人工智能 AI 大模型

Rola详解国外住宅IP代理选择的8个方法,稳定的海外IP哪个靠谱?

Geek_bf375d

爬虫 代理IP 免费代理ip 跨境电商 IP 路由

企业网站建设怎么做?

九凌网络

FACEBOOK有哪些错误养号行为?罗拉ROLA-IP为您详解

Geek_bf375d

代理IP 免费代理ip 跨境电商 爬虫软件 IP 路由

StarRocks 算子落盘:让大查询又快又稳

StarRocks

数据库 OLAP StarRocks

罗拉ROLA告诉你Facebook广告账号被封怎么办?

Geek_bf375d

爬虫 代理IP 代理IP设置 免费代理ip 跨境电商

主流的低代码平台有哪些?程序员应该如何与低代码相处?

高端章鱼哥

软件开发 低代码 JNPF

现在的我们需要怎么去布局一级

币离海

WorkPlus解放企业应用开发,实现跨平台无缝切换

WorkPlus

罗拉ROLA告诉你选择海外住宅代理IP服务供应商要注意哪些问题?

Geek_bf375d

爬虫 跨境电子商务 代理IP 代理IP设置 免费代理ip

罗拉ROLA告诉你美国IP代理如何获取?适用于哪些场景?

Geek_bf375d

爬虫 代理IP 代理IP设置 免费代理ip 跨境电商

罗拉ROLA分析亚马逊频繁扫号下的跨境电商,跨境电商卖家应该何去何从?

Geek_bf375d

爬虫 代理IP 代理IP设置 免费代理ip 跨境电商

OpenAI 曾收到 AI 重大突破警告;半独立的 OpenAI 比与微软合并更好丨 RTE 开发者日报 Vol.91

声网

海外代理IP测试|如何检测代理IP质量?罗拉ROLA详解方法与工具全干货!

Geek_bf375d

爬虫 代理IP 代理IP设置 免费代理ip 跨境电商

工作流引擎的架构设计与对比

小狗围观科幻

人工智能应用:文本分类的技术突破与实战指导

不在线第一只蜗牛

人工智能 文本 技术 优化体系

为什么Facebook运营需使用IP代理?罗拉ROLA详解有哪些美国IP代理好用?

Geek_bf375d

爬虫 代理IP 代理IP设置 免费代理ip 跨境电商

NEO: A Learned Query Optimizer 论文

Downal

【Spring Cloud实战】分布式系统控制与组件应用

快乐非自愿限量之名

分布式 服务器 组件 spring-cloud

罗拉Rola知道IP地址如何变更的吗?

Geek_bf375d

爬虫 跨境电子商务 代理IP 代理IP设置 免费代理ip

HashML——让更多企业读懂数据,用好AI

酷克数据HashData

跨境电商有没好的代理ip系统推荐?罗拉ROLA告诉你

Geek_bf375d

代理IP 代理IP设置 免费代理ip 跨境电商 爬虫分享

深度解读:Raft是Paxos的一个变种么?

小猿姐

数据库 raft PAXOS

HDD城市站九城联动,超1500位HarmonyOS开发者积极参与

最新动态

WorkPlus实现完全私有化部署,企业数据安全有保障

WorkPlus

WorkPlus即时通讯,打通上下游产业链,构建企业生态圈

WorkPlus

如何让你的网络推广实现最大性价比

九凌网络

中国自主的数据库评测,是如何开展的?_数据库_王一鹏_InfoQ精选文章