Ruby 2.2.0 发布,支持增量式垃圾收集和符号的垃圾收集

  • João Miranda
  • 臧秀涛

2015 年 1 月 6 日

话题:Ruby语言 & 开发

Ruby 2.2.0 已于 2014 年 12 月 25 日发布,这是给 Ruby 开发者的圣诞礼物。该版本的亮点包括一些垃圾收集方面的改进:引入了一个新的增量式垃圾收集算法,支持对符号(Symbol)进行垃圾收集。核心类和标准库方面也有小幅改进。

根据Ruby 2.1.0中分代垃圾收集(RGenGC)相关的说明,分代方式可以改进 GC 吞吐量。在新版本中,Ruby 的维护者继续引入了重要的改进。大部分对象都会在很年轻的时候死掉,根据这个假设,分代垃圾收集将对象分为几个代。这个假设使得对较年轻对象的处理有较高的吞吐量和较低的延迟,因为较老的对象会在内存不足时才去计算是否要删除。不过也意味着,较老的对象仍然要承受高延迟之困。

增量式垃圾收集(RIncGC)是在分代垃圾收集的基础上构建的,致力于在维持同样吞吐量的前提下减少停顿时间。通过将标记阶段(把对象标记为可以进行垃圾收集)与 Ruby 的正常执行交错进行,较少了停顿时间。而在 Ruby 2.2.0 之前,标记阶段要占用很大的一步。

RGenGC 和 RIncGC 都不能管理所有对象,意味着某些对象不会被提升到较老的一代。主要是因为 C 扩展,无法保证全部满足 RGenGC 和 RIncGC 的约束。在 RubyConf 2014 大会上, Koichi Sasada 详细描述了 RGenGC 和 RIncGC。如果想了解所有的算法细节和性能基准测试,这是很好的材料。

全局停顿GC与增量式GC 之对比 来源:Koichi Sasada

RIncGC消除了长期停顿 来源:Koichi Sasada

Ruby 2.2.0 引入的对符号的垃圾收集,也改进了 Ruby 的内存管理。这个改进如此之大,乃至计划于 2015 年秋季发布的Ruby on Rails 5.0,将仅支持 Ruby 2.2 及以上的版本。

Rails 5.0 将仅支持 Ruby 2.2 及以上的版本。Ruby 2.2 带来的很多优化都非常棒,但是对 Rails 而言,符号的垃圾收集是最重要的。这意味着在处理来自外部的字符串时,可以轻松很多。而且我们可以完全转换到最新的 Ruby 带来的关键字参数(keyword arguments)和其他所有良好特性。

因为 Ruby 内部会将每个符号映射到一个整形数(integer),带来了一个问题。CRuby(用 C 实现的 Ruby)将这个整形数用作符号的 ID。如果一个符号在 Ruby 端释放了,之后又创建了同样的字符串,那会出现不同的 CRuby 整形数 ID。这意味着,根据语言规范是同样的符号,但是出现了不同的 ID,所以是个 bug。

最简单的解决方案是用字符串替换 CRuby 中的整形数,这样在两端(C 和 Ruby)就一致了。另外,C 扩展将问题变得更复杂了,因为它们会妨碍运行时探测和管理所有的符号。解决方案是将符号分成两组:永久的(immortal)和非永久的(mortal)。永久的符号会继续使用整形数 ID,不会被回收。这类例子包括方法名、变量名、常量和其他语言元素。非永久的符号,比如"foo".to_sym,没有整形数 ID,可以被回收。

非永久的符号与永久的符号之对比 来源:Narihiro Nakamura

Narihiro Nakamura 在RubyKaigi2014大会上描述了符号 GC 的解决方案,还介绍之所以使用这种方案的所有约束条件。

仍然是内存管理方面,Ruby 2.2.0 还提供了一个选择,即使用jemalloc代替系统的 malloc,此举有可能会提高速度,并减少内存碎片。这还是一个实验性特性,在收集到更多性能数据和使用案例后才会正式提供。

诸如 system() 和 spawn() 等创建进程的方法,在可能的情况下会使用vfork(2),代替了 fork()。这种改变也会提高性能,尤其是当父进程会消耗大量内存时。这也是个实验性特性,未来可能会发生变化。

核心库现已支持 Unicode 7.0,还引入了一些新方法,如Enumerable#slice_afterEnumerable#slice_whenFloat#next_float、Float#prev_floatFile.birthtime、File#birthtimeString#unicode_normalize

Ruby 2.2.0 废弃了 mathn 库,同时还更新了其他一些库:

  • Psych 2.0.8
  • Rake 10.4.2
  • RDoc 4.2.0
  • RubyGems 2.4.5
  • test-unit 3.0.8
  • minitest 5.4.3

更多细节,包括废弃的一些 C API 以及一些非兼容的改变,详见Ruby 2.2.0 相关新闻。与 Ruby 2.1.0 相比,Ruby 2.2.0 有 1557 处文件改动,包括 125039 条插入和 74376 条删除。

查看英文原文:Ruby 2.2.0 Released, Featuring Incremental and Symbol GC

Ruby语言 & 开发