QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Jane Street 构建低延迟 OCaml GC 的实践

  • 2015-04-16
  • 本文字数:1176 字

    阅读完需:约 4 分钟

Jane Street 是一家特别重视技术的贸易公司,同时也是目前世界上最大的 Caml 和 OCaml 用户。近日,该公司技术部门负责人 Yaron Minsky 撰文介绍了正在进行中的构建低延迟 OCaml GC 的工作。

在垃圾回收中,有一个众所周知的问题,就是它会导致不可预知的应用程序中断。虽然 OCaml GC 在延迟方面已经相当出色(一方面,“主堆(major heap)”回收增量进行,即可以“分片(slice)”完成;另一方面,“次堆(minor heap)”回收的速度也非常快),但它仍然存在一些问题:

  • 没有性能分析:现有的运行时无法知道不同部分回收工作所耗费的时间,难以优化。
  • 错误提升:在次堆回收时,如果对象恰巧出现短暂的不可达,那么它会被错误地提升到主堆中。
  • 触发:如果服务器需要在突发流量的情况下仍然保持低延迟,那么我们希望垃圾回收可以延后,在应用程序空闲时执行。但现有的运行时根据次堆分配触发垃圾回收,无法满足此类场景。
  • 增量回收不完善:主堆采用增量回收机制,但数组会一次性回收,所以当数组较大时会出现问题。
  • 即时计算:现有的运行时根据上次次堆回收时提升到主堆的对象的多少来确定主堆片的大小。如果提升的对象很多,那么会立即进行主堆回收。但这时,正在进行的任务可能尚未完成。而且,对于快速响应系统,我们同样希望垃圾回收可以延后执行。

为了解决上述问题,他们在 OCaml GC 作者 Damien Doligez 的帮助下做了如下工作:

  • 改进性能分析:为垃圾回收器增加了一组探针,详细记录垃圾回收过程的每个阶段。
  • “老化(Aging)”:为了减少错误提升,允许对象在次堆中停留多个次堆回收周期。
  • 完善增量回收:垃圾回收的多个阶段都改为可中断的,包括数组扫描。
  • 将主堆片回收与次堆回收分离:在现有的运行时中,主堆片回收与次堆回收总是一起完成。但在低延迟分支中,二者可以在任意时间单独执行。同时,该分支允许在应用程序层面调度垃圾回收。
  • 使工作计算更平滑:该低延迟分支由跟踪下次主堆片回收的工作量改为跟踪接下来 N 次主堆片回收的工作量,并将数值保存在一个环形缓冲区里。
  • 空闲列表分段:查找空闲块的开销占次堆回收开销的一大部分。在许多 OCaml 应用程序中,块都非常小。为了利用这一点,他们正在该低延迟分支中实现一组根据尺寸划分的空闲列表。

虽然许多工作还在进行之中,但已经取得的成果让他们觉得这项工作非常有前途。通过使用一个包含了上述大多数更改的编译器版本及应用程序驱动的垃圾回收作业,他们目前已经在一个真实的生产应用中将“尾延迟(tail latency)”降低到了原来的 1/3。不过,也有部分成果不尽人意。比如,老化机制节省了对象提升开销,但次堆回收本身的开销增加了,两者基本相互抵消了。

感谢徐川对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

2015-04-16 08:292812
用户头像

发布了 1008 篇内容, 共 396.6 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

专业的思维导图软件XMind Pro for mac

Mac相关知识分享

思维导图软件

Autodesk AutoCAD 2024 Mac中文破解版 cad2024下载安装

Rose

做梦都想拥有的陪伴对象,AI居然免费帮我实现了...文中附送体验地址!

可信AI进展

中国AI开发者应用生态调研报告

易观分析

2024 必备工具:JProfiler,解锁 Java 应用性能密码

Rose

【转载】把大模型做实 把供应链做透: 京东推出言犀大模型

京东科技开发者

【玩转金融素材生成】探索交互式AIGC组合素材生成技术

京东科技开发者

腾讯TVQA斩获ECCV 2024压缩视频质量评估比赛冠军

Geek_2d6073

IntelliJ IDEA 2024:编程新境界,高效开发新引擎

Rose

捷行2024Train-the-Trainer微课程系列-用户故事地图实操工作坊

ShineScrum

Mac 设计的文本编辑器软件WonderPen妙笔 for Mac

Mac相关知识分享

数据驱动营销:淘宝商品详情API助力电商运营精准制胜

代码忍者

API 接口 pinduoduo API

Go 错误处理指北:Defer、Panic、Recover 三剑客

江湖十年

面试 Go web 后端】

Microsoft Remote Desktop:在不同设备之间轻松地共享文件和资源

Rose

AI驱动的低代码未来:加速应用开发的智能解决方案

天津汇柏科技有限公司

低代码平台 AI 人工智能

QCN6224 long-range IoT:Can Wi-Fi 7 Outperform LoRa and NB-IoT in IoT Applications?

wallyslilly

qcn9274 qcn6274

AlDente Pro for Mac:保护电池健康的小工具

Rose

AnyGo for Mac 在iPhone / iPad上轻松模拟GPS位置

Rose

OpenAI被爆12月发布其Orion AI模型!波兰“OFF”电台解雇所有记者,启用AI“主持人”|AI日报

可信AI进展

人工智能 | 智谱 AI 大模型

测试人

人工智能 软件测试

结构仿真流体仿真热仿真分析咨询报价 点击友商科技

Geek_2d6073

云管平台供应商大汇总看这里!

行云管家

云计算 云服务 云管平台 云管理

数据开发革新篇:逻辑数据编织平台重塑开发流程

Aloudata

数据仓库 数据分析 数据开发 数据虚拟化 数据编织

重工业数字化转型创新实践:某国家特大型钢铁企业如何快速落地基于实时数仓的数据分析平台

tapdata

钢铁行业数字化转型 实时数仓解决方案 hive数据如何同步到doris oracle数据同步方案 mysql数据复制

西部数据亮相安博会,展出多款领先存储产品

Geek_2d6073

软件设计文档怎么写?详细步骤与注意事项

爱吃小舅的鱼

软件 软件开发 软件设计

多功能文件提取软件File Juicer for Mac(Mac文件数据提取工具)

Mac相关知识分享

Downie 4 :流行的 Mac 视频下载工具

Rose

Lazada淘宝详情API的价值与应用解析

科普小能手

API 接口 API 测试 lazada商品数据接口 lazada API接口 lazada API

Charles for Mac 强大的网络代理工具

Rose

华大北斗芯片级产品矩阵亮相第三届北斗规模应用国际峰会

江湖老铁

Jane Street构建低延迟OCaml GC的实践_后端_谢丽_InfoQ精选文章