写点什么

国产数据库这十年

阿里巴巴折射的自研发展史

2019 年 10 月 22 日

国产数据库这十年

在 IT 行业里,数据库芯片操作系统向来被视为核心“三驾马车”。不巧的是,长久以来中国、中国企业在这三个领域里都落后于人。


昨天我看到新闻说,世界互联网大会上,阿里云自研的数据库PolarDB当选了世界互联网领先科技成果。再之前,蚂蚁金服的OceanBase数据库也登顶了 TPC-C 排行榜的榜首。国产数据库,终于看到了崛起的希望。


在自研技术领域,阿里巴巴是我非常佩服的一家公司,个人认为阿里巴巴的技术发展史,足以管中窥豹地折射中国技术的自研史。(国产数据库当然不只是阿里巴巴一家为代表,像 PingCAP、腾讯云还有更多的国产传统数据库厂商如达梦、南大通用等等都是个中翘楚,本文只以阿里为视角,如有冒犯说声抱歉。)


10 年前,阿里巴巴曾是甲骨文数据库在亚洲的最大客户,10 年后的今天,阿里云自研的数据库已经跑在世界前列。数据库变革的星星之火,早已点燃。


云厂商掀起数据库变革的序幕


从上世纪 70 年代诞生起,传统数据库就迅速从科研领域向全世界蔓延,企业因此有了更稳健的 IT 系统,如今已经发展成为数百亿美元的市场规模。以 Oracle 为代表的传统数据库厂商因此赚得盆满钵满,光是 Oracle 和 IBM DB2 就占据了超过 80%的份额。


然而事实情况是,企业受益于传统数据库的同时也被其所困,主要原因就是传统数据库太昂贵、无法适应互联网流量规模场景需求。再加上传统数据库极度依赖于DBA人员的技术能力,导致其运维起来也十分痛苦。


传统数据库问题这么多,开源数据库是否是一个解决方案呢?行,也不行。开源数据库对企业而言是一个新的选择,但对于体量庞大到阿里这样的企业而言,差距仍旧很明显。于是,自研的故事就发生了。


故事要从 2009 年,阿里巴巴举起去IOE大旗开始讲起,在这一大背景下,阿里先后自研了金融级数据库 OceanBase 以及云原生数据库 PolarDB,并且在 2013 年完成了对 Oracle 的全面替代。这不仅是国内云计算发展的历史性节点,也是数据库技术变革的转折点。


众所周知,IBM 的小型机、Oracle 的数据库、EMC 存储设备三者对于企业 IT 系统而言有多重要无需赘述,如果没有过硬的技术实力去自研这些核心技术产品的替代品,去 IOE 就将成为一个笑话。我相信阿里巴巴刚提出去 IOE 口号的时候,等着看笑话的人不少,但现在,时间说了真话。


意料之外却又在情理之中,数据库变革的这场大戏,最终由云厂商们掀开了序幕。过去几年,云厂商以黑马之势成为数据库行业的一股新势力。在 Gartner 发布的2018年数据库魔力象限中,阿里云、AWS、Google 等云厂商均成功入选。而曾经风靡业界的传统数据库市场份额逐年下降,根据第三方机构显示,到 2021 年,该数据库市场还会下降 20%至 30%。


IT 行业新老交替的例子比比皆是。传统影像时代的柯达在数码影像技术时代早已被遗忘;手机领域巨人诺基亚和摩托罗拉也在智能手机时代逐渐淡出视线……


阿里云与数据库这十年


数据库并非新兴行业,在它 40 多年的发展过程中经历了多个时代的演进,但前 30 多年都鲜有中国公司的参与,就更别提做出一款世界级的数据库了。长久以来,在核心的芯片、数据库、操作系统等关键节点下,中国公司、中国技术都受制于人。


以甲骨文为代表的传统商业数据库仍旧统治着市场,几乎每家大型企业都需要从甲骨文买来大量数据库软件,价格居高不下、学习门槛高、维护困难,但企业们别无他选。然而,迈入全面云计算时代的今天,云原生数据库的出现将改变这一局面。Gartner 预测,到 2023 年,全球 3/4 的数据库都会跑在云上。


企业上云是毋庸置疑的下一个浪潮,企业采用云上 IT 架构将给云原生数据库带来更多市场蛋糕。天然拥有云计算弹性能力、兼具开源数据库的易用、开放特点,又没有抛弃传统数据库的管理和处理性能优势,给企业一个不选它的理由?


业界有个玩笑,阿里云的销售团队出去宣讲产品,只要提到支撑了“双 11”的海量洪峰,一般都能拿下客户的单子。案例虽然夸张,但确实在理。PolarDB 在“双 11”的练兵场景下打磨,可以获得的性能和产品力的提升怎么估计都不算乐观。


对于阿里巴巴这种集团企业而言,我相信自研技术产品光满足集团自身需求远远不够,如何赋能于行业才是企业责任的体现。我记得今年阿里云十年峰会上行癫宣布,阿里巴巴所有的技术将通过阿里云对外输出,全集团的科研力量将融会贯通,达摩院的能力与云全面结合。这对于阿里云、PolarDB 的意义如何不言而喻。


我之前采访过一位专家,问为什么中国的技术没有能形成完整的生态,而更多是作为生态的组成部分?他解释道:西方技术具有早发优势,在大部分领域领先我们几十年建立起了一个庞大的生态,在这些领域里,中国技术很难有崛起、超车的可能。中国技术的机会在于弯道超车,在于那些新兴的技术领域。


现在看来,云原生数据库可能就是国产数据库的下一个弯道之一了。


未来,可期。


作者介绍


小智,InfoQ 编辑。关注架构、开源、泛互联网科技领域,个人公众号小智的互联网观察,个人微信:ryantz


原文链接


国产数据库这十年:阿里巴巴折射的自研发展史


2019 年 10 月 22 日 22:073209
用户头像
小智 InfoQ 主编

发布了 398 篇内容, 共 309.2 次阅读, 收获喜欢 1726 次。

关注

评论

发布
暂无评论
发现更多内容

现成花火交易所系统软件APP开发案例

开發I852946OIIO

系统开发

架构师训练营—大作业(一)

Geek_shu1988

高德地图、百度地图 都不如“人的智慧”

Sicolas Flamel

Python 深度思考 日常思考

区块链与物联网融合理论架构

CECBC区块链专委会

区块链

第十一周作业

Jack

「架构师训练营 4 期」 第一周 - 1001

凯迪

架构师训练营—第十三周作业

Geek_shu1988

架构师训练营—第十三周学习总结

Geek_shu1988

关于食堂就餐卡系统设计

MR.X

系统设计 食堂就餐卡

零基础工程师绘图指南,半小时水平越级提升!

Python编程参考官方账号

架构 设计 软件工程 分层架构

区块链2020年终盘点

CECBC区块链专委会

区块链

2021健康快乐

escray

2021

IPFS矿机软件系统开发|IPFS矿机APP开发

开發I852946OIIO

系统开发

从考研失败到最具成长力员工,这个2020就像过山车一样

Java鱼仔

程序员 面试 程序人生 考研

【计算机内功修炼】一:看完这篇还不懂线程与线程池你来打我

码农的荒岛求生

高并发 线程池 进程 高性能 线程’

Hadoop 编程实战:HDFS API 编程样例

罗小龙

Java hadoop hdfs 编程

第一周架构方法-练习-食堂就餐卡系统设计

潘涛

架构师训练营 4 期

交报告 | 2020年读完的50本书

浪亦有道

架构师训练营—大作业(二)

Geek_shu1988

架构入门感悟之十一

莫问

DeFi中的关键——智能合约 | 白话区块链入门220

CECBC区块链专委会

区块链

想法

BerryMew

2020年Python文章盘点,我选出了个人TOP10

Python猫

Python 学习 编程 技术

探讨典型互联网系统使用的技术方案

andy

Caddy服务器使用方法

Rayan

运维 https 服务器 SSL证书

AEM公链APP系统开发|AEM公链软件开发

开發I852946OIIO

系统开发

Python+Selenium——自动办公美梦的破碎与重建

Sicolas Flamel

Python 自动化 办公

「架构师训练营 4 期」 第一周 - 001002

凯迪

微信气质

池建强

微信

RocketMQ避坑指南:你部署的RocketMQ集群真的是高可用?

公众号『中间件兴趣圈』

架构 RocketMQ 故障分析 消息队列

SSH 免密码/免用户名/免IP登录云服务器实践

Python编程参考官方账号

SSH 服务器

国产数据库这十年-InfoQ