Go 1.4+ 垃圾收集器计划与路线图

  • 臧秀涛

2014 年 8 月 13 日

话题:语言 & 开发架构Go

自从 Go 语言于 2009 年 11 月对外宣布以来,短短几年时间,这门语言发展迅猛,性能也在不断提升,而垃圾收集器的改进正是其中的重要一环。

Go 1.1中,Go 语言引入了并行垃圾收集器,可以减少程序在多 CPU 上运行时的延迟;同时垃圾收集也更为精确了,以牺牲较少的 CPU 时间为代价,换来了堆内存的显著减少。到了今年 6 月份发布的Go 1.3中,精确性有所改进,又实现了检查栈上的值时的精确性。

那后续版本中,垃圾收集器会有怎样的变化呢?Richard L. Hudson 近日撰文介绍了 Go 1.4+ 垃圾收集器的计划和路线图。

文中指出,计划于 2015 年 6 月发布的 Go 1.5 的 GC 的目标是减少延迟,从而使 Go 语言能够满足对响应时间要求比较高的系统。该版本希望将 GC 延迟限制在 10ms 以内,而且每 50ms 保证 Go 应用代码有 40ms 以上的执行时间。实现上将考虑一种混合式的 Stop-the-World(STW)/ 并发垃圾收集器(CGC)。CGC 的主要工作将在一个或多个专用的 CPU 上完成,而应用代码则在其他 CPU 上执行。

文中提到,用繁复的垃圾收集术语来讲,现在为 Go 1.5 提议的垃圾收集器是一种“非分代的、非移动的、并发的、三色的标记清除垃圾收集器”。像分代,JVM 的 Hotspot 实现、Google 的 v8 JavaScript 引擎等采用的就是分代垃圾收集技术。Hotspot 中的堆区分为年轻代和老年代,不同的代会针对性地选择不同的收集算法。移动对象是复制类垃圾收集算法常用的一种操作,不过移动有一个缺点,需要修改指向被复制对象的所有指针。三色是 GC 跟踪过程中的一种标记策略,认定为活对象的标记为黑色,可能是死对象的标记为白色;可以参考这个帖子。正在处理或者需要重新处理的标记为灰色。标记完成之后,仍为白色的则是垃圾。具体算法,感兴趣的读者可以参考《The Garbage Collection Handbook: The Art of Automatic Memory Management》一书。低延迟意味着会影响吞吐量,但是影响程度如何,还有待观察。文中指出,随着 CPU 核数的增加,拿出一个或多个核来执行 GC,应该不是很大的问题。

至于 Go 1.6 这个将于 2015 年 12 月发布的版本,其 GC 将根据 1.5 版本的经验、用户反馈和使用案例来改进。1.6 版本很可能会加入指针碰撞分配(bump pointer allocation)和分代复制收集技术。

为配合垃圾收集器的改造,1.4 版本中将去掉使用了 Go 指针及各种与并发或复制收集器不兼容的不安全指针结构的 C 运行时代码,用户也需要去掉其代码中的不兼容结构。

相关讨论可以参阅golang-dev 邮件列表。HackerNews 上的讨论也很热烈。有些网友介绍了实际使用体验。感兴趣的读者可以参考。


感谢郭蕾对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

语言 & 开发架构Go