MySQL 与 PostgreSQL:该选择哪个开源数据库?哪一个更好?

  • 张龙

2013 年 12 月 30 日

话题:MySQL语言 & 开发架构

Naresh Kumar是一位软件工程师与热情的博主,对编程与新事物充满了激情和兴趣。近日,Naresh 撰写了一篇博文,对开源世界最常见的两种数据库 MySQL 与 PostgreSQL 的特点进行了详尽的分析和比对。

如果打算为项目选择一款免费、开源的数据库,那么你可能会在 MySQL 与 PostgreSQL 之间犹豫不定。MySQL 与 PostgreSQL 都是免费、开源、强大、且功能丰富的数据库。你主要的问题可能是:哪一个才是最好的开源数据库,MySQL 还是 PostgreSQL 呢?该选择哪一个开源数据库呢?

在选择数据库时,你所做的是个长期的决策,因为后面如果再改变决定将是非常困难且代价高昂的。你希望一开始就选择正确。两个流行的开源数据库 MySQL 与 PostgreSQL 常常成为最后要选择的产品。对这两个开源数据库的高层次概览将会有助于你选择最适合自己需要的。

MySQL

MySQL 相对来说比较年轻,首度出现在 1994 年。它声称自己是最流行的开源数据库。MySQL 就是 LAMP(用于 Web 开发的软件包,包括 Linux、Apache 及 Perl/PHP/Python)中的 M。构建在 LAMP 栈之上的大多数应用都会使用 MySQL,包括那些知名的应用,如 WordPress、Drupal、Zend 及 phpBB 等。

一开始,MySQL 的设计目标是成为一个快速的 Web 服务器后端,使用快速的索引序列访问方法(ISAM),不支持 ACID。经过早期快速的发展之后,MySQL 开始支持更多的存储引擎,并通过 InnoDB 引擎实现了 ACID。MySQL 还支持其他存储引擎,提供了临时表的功能(使用 MEMORY 存储引擎),通过 MyISAM 引擎实现了高速读的数据库,此外还有其他的核心存储引擎与第三方引擎。

MySQL 的文档非常丰富,有很多质量不错的免费参考手册、图书与在线文档,还有来自于 Oracle 和第三方厂商的培训与支持。

MySQL 近几年经历了所有权的变更和一些颇具戏剧性的事件。它最初是由 MySQL AB 开发的,然后在 2008 年以 10 亿美金的价格卖给了 Sun 公司,Sun 公司又在 2010 年被 Oracle 收购。Oracle 支持 MySQL 的多个版本:Standard、Enterprise、Classic、Cluster、Embedded 与 Community。其中有一些是免费下载的,另外一些则是收费的。其核心代码基于 GPL 许可,对于那些不想使用 GPL 许可的开发者与厂商来说还有商业许可可供使用。

现在,基于最初的 MySQL 代码还有更多的数据库可供选择,因为几个核心的 MySQL 开发者已经发布了 MySQL 分支。最初的 MySQL 创建者之一 Michael "Monty" Widenius 貌似后悔将 MySQL 卖给了 Sun 公司,于是又开发了他自己的 MySQL 分支 MariaDB,它是免费的,基于 GPL 许可。知名的 MySQL 开发者 Brian Aker 所创建的分支 Drizzle 对其进行了大量的改写,特别针对多 CPU、云、网络应用与高并发进行了优化。

PostgreSQL

PostgreSQL 标榜自己是世界上最先进的开源数据库。PostgreSQL 的一些粉丝说它能与 Oracle 相媲美,而且没有那么昂贵的价格和傲慢的客服。它拥有很长的历史,最初是 1985 年在加利福尼亚大学伯克利分校开发的,作为 Ingres 数据库的后继。

PostgreSQL 是完全由社区驱动的开源项目,由全世界超过 1000 名贡献者所维护。它提供了单个完整功能的版本,而不像 MySQL 那样提供了多个不同的社区版、商业版与企业版。PostgreSQL 基于自由的 BSD/MIT 许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。

可靠性是 PostgreSQL 的最高优先级。它以坚如磐石的品质和良好的工程化而闻名,支持高事务、任务关键型应用。PostgreSQL 的文档非常精良,提供了大量免费的在线手册,还针对旧版本提供了归档的参考手册。PostgreSQL 的社区支持是非常棒的,还有来自于独立厂商的商业支持。

数据一致性与完整性也是 PostgreSQL 的高优先级特性。PostgreSQL 是完全支持 ACID 特性的,它对于数据库访问提供了强大的安全性保证,充分利用了企业安全工具,如 Kerberos 与 OpenSSL 等。你可以定义自己的检查,根据自己的业务规则确保数据质量。在众多的管理特性中,point-in-time recovery(PITR)是非常棒的特性,这是个灵活的高可用特性,提供了诸如针对失败恢复创建热备份以及快照与恢复的能力。但这并不是 PostgreSQL 的全部,项目还提供了几个方法来管理 PostgreSQL 以实现高可用、负载均衡与复制等,这样你就可以使用适合自己特定需求的功能了。

平台

MySQL 与 PostgreSQL 都出现在一些高流量的 Web 站点上:

  • MySQL:Slashdot、Twitter、Facebook 与 Wikipedia
  • PostgreSQL:Yahoo 使用了一个修改的 PostgreSQL 数据库来处理每天数以亿计的事件,还有 Reddit 和 Disqus

MySQL 与 PostgreSQL 都能运行在多个操作系统上,如 Linux、Unix、Mac OS X 与 Windows。他们都是开源、免费的,因此测试他们时的唯一代价就是你的时间与硬件。他们都很灵活且具有可伸缩性,可用在小型系统和大型分布式系统上。MySQL 在一个领域上要比 PostgreSQL 更进一步,那就是它的触角延伸到了嵌入式领域,这是通过 libmysqld 实现的。PostgreSQL 不支持嵌入式应用,依然坚守在传统的客户端 / 服务器架构上。

MySQL 通常被认为是针对网站与应用的快速数据库后端,能够进行快速的读取和大量的查询操作,不过在复杂特性与数据完整性检查方面不太尽如人意。PostgreSQL 是针对事务型企业应用的严肃、功能完善的数据库,支持强 ACID 特性和很多数据完整性检查。他们二者都在某些任务上具有很快的速度,MySQL 不同存储引擎的行为有较大差别。MyISAM 引擎是最快的,因为它只执行很少的数据完整性检查,适合于后端读操作较多的站点,不过对于包含敏感数据的读 / 写数据库来说就是个灾难了,因为 MyISAM 表最终可能会损坏。MySQL 提供了修复 MySQL 表的工具,不过对于敏感数据来说,支持 ACID 特性的 InnoDB 则是个更好的选择。

与之相反,PostgreSQL 则是个只有单一存储引擎的完全集成的数据库。你可以通过调整 postgresql.conf 文件的参数来改进性能,也可以调整查询与事务。PostgreSQL 文档对于性能调优提供了非常详尽的介绍。

MySQL 与 PostgreSQL 都是高可配置的,并且可以针对不同的任务进行相应的优化。他们都支持通过扩展来添加额外的功能。

一个常见的误解就是 MySQL 要比 PostgreSQL 更容易学习。关系数据库系统都是非常复杂的,这两个数据库的学习曲线其实是差不多的。

标准兼容性

PostgreSQL 旨在实现 SQL 兼容性(当前标准是 ANSI-SQL:2008)。MySQL 则兼容大部分 SQL,不过还有自己的扩展,可以支持 NoSQL 特性,这在参考手册中都有介绍。每种方式都有优缺点。兼容标准会让数据库管理员、数据库开发者与应用开发者更舒服一些,因为这意味着他们只需学习一套标准、一套特性和命令即可。这会节省时间,提升效率,也不会被锁定在特定的厂商上。

支持使用非标准的自定义功能的人们认为这样可以快速采用新的特性,而不必等待标准进程完成。ANSI/ISO 标准在不断演化,因此标准兼容性也是个变化的目标:知名的关系型数据库 Microsoft SQL Server、Oracle 与 IBM DB2 也只是部分兼容于标准。

结论

虽然有不同的历史、引擎与工具,不过并没有明确的参考能够表明这两个数据库哪一个能够适用于所有情况。很多组织喜欢使用 PostgreSQL,因为它的可靠性好,在保护数据方面很擅长,而且是个社区项目,不会陷入厂商的牢笼之中。MySQL 更加灵活,提供了更多选项来针对不同的任务进行裁剪。很多时候,对于一个组织来说,对某个软件使用的熟练程度要比特性上的原因更重要。

MySQL语言 & 开发架构