写点什么

在堆增大的同时确保垃圾回收停顿时间短暂——专访 Cliff Click 博士

2010 年 4 月 27 日

为了达到所需的吞吐量,越来越多的采用 Java 编写的企业级应用把大部分处理过程从数据库转移到内存中。这类应用的特点是存在大量活跃堆数据和线程级别的并发,并且往往运行在高端多核处理器上。这种特点意味着堆大小和垃圾回收停顿时间之间的强相关性成为 Java 应用伸缩性的主要限制之一,专家进行了大量的研究以努力改进这种情况。

例如预计今年推出的 Java 7 中,即将包含一个新的垃圾回收器— Garbage-First —目的是确保持续的短停顿时间,尽量消除低延迟 / 高吞吐量之间的折衷。与这种纯软件方法相反 Azul Systems 硬件基于自定制的 54 核处理器构建,专为运行高标准 Java 应用程序设计,支持内置于处理器的写操作和读操作屏障。InfoQ 最近采访了 HotSpot Server 编译器的前架构师和首席程序员、现任 Azul Systems 公司首席 JVM 架构师的 Cliff Click 博士,讨论了 Azul 的解决方案。第一个问题是 Azul 硬件适用的领域:

任何需要可靠的低停顿时间(业务关键应用)或者超大堆的领域。类似金融建模的超大堆应用可能需要 300G 大小的堆存储金融数据,然后通过数百个处理器并行操作。我们针对 Java DB 缓存也做得很好,在缓存中提供 10 到 100G 的数据。低停顿时间应用通常意味着你希望及时地将网页回馈给客户。几秒钟的延迟通常会让客户认为“网站关闭了”并转向他处或者提出投诉。一些大牌公司在 Azul 设备上部署 Web 展现应用,因为我们能够提供高负载下的出色(平稳)响应时间。一些典型的用途如客户的门户网站、大缓存(针对性能和扩展性)和内部业务应用的 Web 版(如库存管理、“请假系统”等等)。

InfoQ: 按照我的理解,Azul 硬件的关键优势之一是它直接支持写操作和读操作屏障以获得低 GC 停顿。是这样吗?

是啊!特别是,拥有读操作屏障允许你切换到较简单的 GC 算法—更易于并发、扩展和强壮。我们在多年前已经改变了算法,我们的垃圾回收机制能够处理超越竞争对手数量级大小的堆(和分配频率)。

InfoQ: 显然采用软件也能够做到。哪些情况下值得使用硬件?

学术文献已经对该领域做了很多探讨,已知的问题是单线程性能下降大约 10% 到 20%。IBM 的 Metronome 硬实时垃圾回收器采用 Brooks 风格的读操作屏障,并极力把延迟时间降低到正常回收器的 30%…但是,一些消耗在于硬实时和不仅仅是读操作屏障。IBM 的确卖出了 Metronome 回收器(我相信大部分是军事领域)。

InfoQ: Azul 的 GC 停顿与 Oracle 的 Garbage-First 垃圾回收器或者使用 Java 实时产品相比如何?

我觉得 G1 将很有意思…如果有的话。我们的垃圾回收器到目前为止已经在生产环境中稳定运行了 4 年。我认为现在与 G1 比较为时过早。实时 Java 产品往往存在一些问题导致它们不适合大型企业应用——通常是 GC 局限于 4G 堆大小或者单垃圾回收器(有时是单 mutator 线程)。RTSJ 规范要求程序重写以使用有限的内存。

InfoQ: 对于 GC 来说,并发存在哪些局限?是否存在某部分 GC 算法在非并发情况下效率也很高?

人们总是把堆搞得难以并发收集,但实际上大多数大型堆有足够的并发性。其他 GC 问题也可以逐个解决,我们多年来一直在进行这项工作,并有了极具扩展性和并发性的 GC。我们能够(有时候)有效地并发运行超过 100 个 GC 线程。

InfoQ: 是否计划开源 Azul 虚拟机(或者重新为 OpenJDK 项目工作)?

我们一直在考虑开源部分成果,因为这很有意义。例如,我们的 CheckedCollections 和 LockedCollections 捕捉(或者纠正)常见的编程错误,如标准的非锁定 Collections 类被多个线程使用同时一个线程正在写入。

Azul 虚拟机的更多信息可以查看这里或者Click 博士的博客

查看英文原文 Keeping Garbage Collection Pauses Short with Growing Heap Sizes: Q&A With Dr. Cliff Click

2010 年 4 月 27 日 08:261170
用户头像

发布了 501 篇内容, 共 214.0 次阅读, 收获喜欢 29 次。

关注

评论

发布
暂无评论
发现更多内容

shell脚本的使用该熟练起来了,你说呢?(篇二)

良知犹存

Shell

【经验分享】打破CMDB认知误区,掌握建设关键!

嘉为蓝鲸

运维 运维自动化 数据可视化 CMDB 配置信息

京东11.11大促背后,那些系统架构经历了些什么?

京东科技开发者

数据库 云计算 云服务

小白也能看懂!教你如何快速搭建实用的爬虫管理平台

华为云开发者社区

Python Docker jenkins

架构师训练营 - 第 10 周课后作业(1 期)

Pudding

软件架构指南

信码由缰

软件架构

消防物联网,为逆行英雄守住第一道生命线

华为云开发者社区

物联网 控制 消防

京东成立探索研究院,打造产业数智化首个源头性科技高地; AI 论文:让机器像人类一样感知三维真实世界

京东科技开发者

人工智能 云计算

划重点!DWS开发的五大要点

华为云开发者社区

数据库 sql DWS

面试大厂被MyBatis源码问到“哑口无言”?这份《MyBatis源码学习笔记+面试真题》助你吊打面试官!

Java成神之路

Java 程序员 架构 面试 编程语言

SpringBoot有多重要?面试用SpringBoot把面试官唬住了要30k都行!

Java成神之路

Java 程序员 架构 面试 编程语言

架构师训练营第一期-第十周学习总结

卖猪肉的大叔

极客大学架构师训练营

架构师训练营第一期-第十周课后作业

卖猪肉的大叔

极客大学架构师训练营

1. 揭秘Spring类型转换 - 框架设计的基石

YourBatman

Spring Framework 类型转换 Converter

牛批!阿里P8Java架构师总结整理了一份Spring MVC详细教程。真香系列!

Java成神之路

Java 程序员 架构 面试 编程语言

盘点c++几种常见的设计模式及具体实现

linux大本营

c++ Linux 后台开发

LeetCode题解:455. 分发饼干,贪心for循环,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

区块链系统面临哪些风险以及有哪些防范措施

CECBC区块链专委会

区块链

基于区块链的区域股权市场创新试点

CECBC区块链专委会

区块链

anyRTC 11月SDK更新

anyRTC开发者

flutter uni-app WebRTC RTC sdk

优秀商业可视化大屏(BI)设计演示

Marilyn

UI 商业智能

阿里P8Java大牛总结的MySQL最全整理(面试题+笔记+导图),面试大厂不再被MySql难倒!

Java成神之路

Java 程序员 架构 面试 编程语言

一个神奇的bug:OOM?优雅终止线程?系统内存占用较高?

华为云开发者社区

sql jdk OOM

Jenkins使用ansible时出现!unreachable错误

Griffenliu

阿里云在应用扩缩容下遇到的挑战与选型思考

阿里巴巴云原生

阿里云 Kubernetes 容器 云原生

蘑菇街Java大牛熬夜纯手写肛出的Spring AOP/IOC思维导图及源码笔记,赶紧收藏学习!

Java成神之路

Java 编程 程序员 架构 面试

架构训练营 - 第10周课后作业 - 学习总结

Pudding

架构师训练营 - 第 11 周课后作业(1 期)

Pudding

40 张图带你搞懂 TCP 和 UDP

云流

编程 程序员 前端 后端 网络

完了!这57道面试题(美团、BAT、携程),我咋一个都不会?

比伯

Java 程序员 架构 面试 计算机

阿里技术专家熬夜一个月肛出内部“微服务学习笔记”,太完美了

小Q

Java 学习 编程 面试 微服务

2021年全国大学生计算机系统能力大赛操作系统设计赛 技术报告会

2021年全国大学生计算机系统能力大赛操作系统设计赛 技术报告会

在堆增大的同时确保垃圾回收停顿时间短暂——专访Cliff Click博士-InfoQ