SAP 创始人鼓吹高并发计算和面向列的数据库

  • Jean-Jacques Dubray
  • 韩锴

2009 年 6 月 1 日

话题:架构DevOps

上周,SAP 的共同创始人 Hasso Plattner 在Sapphire 的主题演讲上讲到

SAP 可以完成公司里的任何查询,并将其展现为某种工业标准格式,比如 Microsoft Excel,而这一切所花费的时间不会超过一秒钟。

Plattner 提出如果组合使用内存数据库、多核和垂直存储技术,这就是可能的。如他所说的

相比于传统的存储方式,垂直存储数据库有一些值得注意的优势:
  • 没有冗余数据,因此减轻了数据管理的负担
  • 没有冗余的软件编码,因此更易升级
  • 数据可直接提供给算法
  • 卓越的灵活性
  • 更容易向客户数据库中加入新的域
  • 面向列的数据库没有闲置或者空白的单元(cell),相较于传统的存储模式,其数据内容可以降低到以前的二十分之一。

面向列的数据库并不是什么新生事物,事实上,它们大约已经有十五年以上的历史了:

  • 面向列的数据库是基于列存储数据的,而不是按照行来存储的
  • 因为它可以将类似于数据集中存放,所以对于很多类型的查询(比如数据仓库查询),都能将磁盘读取时间降到最低。
  • 作为很多 Google 应用程序(比如 Google Map 和 Google Reader)背后的支柱BigTable就是一个面向列的数据库。

另外:

按照 Plattner 的说法,基于列的存储比基于行的存储速度更快,因为它能带来大于 10 倍的压缩量,并且执行数据库的更新操作实际上就是执行插入操作,可能只是简单地插入字符串类型的值。

Plattner 还提到了:

他预言道,“不久的将来,我们就会在一块电路板上看到 8 颗 CPU,每个 CPU 拥有 16 个核。这就是说一块电路板上就拥有 128 个计算单元,这就是所谓的刀片机。今天,一个刀片机可以控制 144GB 的内存,其价格大概是 $6,300。现在,如果你买上 100 个刀片机,花费不过 $1,000,000,就能拥有 12,800 个计算单元,这相对于它提供的的计算能力来说,并不算贵。”

这些技术看上去非常适合云计算。这种能力和性能,能否促进云计算的普及呢?能否加快大型打包程序向多用户使用并按照使用情况付费模式的转变呢?你对此有何看法?

查看英文原文:Hasso Plattner Touts Highly Parallel Computing and Column-Oriented Databases

架构DevOps