Java基准所面临的挑战_Java_Steven Haines

【AICon】如何构建高效的 RAG 系统？RAG 技术在实际应用中遇到的挑战及应对策略？>>> 了解详情 



 写点什么

Brent Boyer 是 Elliptic Group 的一名程序员，他在 IBM 开发者网站上发表了一篇名为“健壮的Java 基准（Robust Java Benchmarking）”的文章。这篇文章包含两个部分，主要探究了如何实现有效的Java 基准。首先，他论述了当前编译器下不同JVM 有着不同的特性和优化，而这些特性或是优化有可能会对性能测试产生负面影响。举例来说，假如有一段复杂的代码段，最后计算得到的是一个从未使用的值，那么强势编译器就会对这段代码进行优化，基准则会忽略这段计算。为了说明这一点，他在他哦个一台计算机上连续运行了很多次相同的代码段，结果运行时都是4.9 秒，但当他删除了打印结果的println 语句之后，运行时间则缩短到0.08 秒。他还指出，时间度量的粒度在不同的操作系统下是不一样的，因此在基准测试的时候，一定要弄清楚当前系统的时间度量粒度。他说，和System.nanoTime() 相比，System.currentTimeMillis() 就不是一个度量运行时间的好方法（），因为它在Windows XP 上只有15ms 的精度（但在具有2.6 内核的Linux 上却可以达到1ms 的精度）。

在阐述了这些特别的行为之后，Boyer 提到了一些在做典型的基准测试时容易忽略的一些问题，比如JVM 缓存、资源回收（如垃圾收集、对象清理）。他认为避免这些问题的唯一有效方式是“预热（warm up）”代码直到代码达到一个稳定态。“预热”过程很耗时间并且很具挑战，因为有些JVM 在其触发编译之前可能已经将一个函数执行了10,000 次（但在编译触发前，代码还处于解析状态）。代码达到稳定状态之后，基准必须对这段代码运行多次，然后才能对结果做出有效的统计分析。

此外，Boyer 还建议采用基准框架来做基准测试，他本人就编写了这样一个框架。该框架能够展示以不同数目的元素来访问数据结构（原生数组、 ArrayLists、Vectors、HashMap、TreeMap 等等）中的数据的差异。Boyer 向大家展示了两个有趣的分析结果：（1）即使运行时短暂到以纳秒计数，其基准框架仍能计算出平均访问时间。（2）不同负载下，某些数据结构的反应令人非常吃惊。其中一个特别的例子是 ConcurrentHashMaps 与TreeMap 的比较：在同样拥有1024 个元素时，CurrentHashMaps 的表现要远远好于 TreeMap，但当元素数量上升到1024x1024 的时候，两者表现就相差不大。这很出乎意料，因为hash map 的搜索时间是常量，但trees 的搜索时间却是log(n)。除却这些令人吃惊的奇怪的结果，这篇文章还是非常值得一读的，尤其是在对Java 代码进行基准评测时，Boyer 提出的建议还是值得参考的。

查看英文原文： The Challenges in Java Benchmarking

发布

暂无评论

促进软件开发及相关领域知识与创新的传播
关于我们
我要投稿
合作伙伴
加入我们
关注我们
联系我们
内容投稿：editors@geekbang.com
业务合作：hezuo@geekbang.com
反馈投诉：feedback@geekbang.com
加入我们：zhaopin@geekbang.com
联系电话：010-64738142
地址：北京市朝阳区望京北路9号2幢7层A701
InfoQ 近期会议
北京 · QCon全球软件开发大会 2024.4.18-20
北京 · AICon 全球人工智能与大模型应用峰会 2024.5.17-18
深圳 · ArchSummit全球架构师峰会 2024.6.14-15
上海 · FCon全球金融科技大会 2024.8.16-17
全球 InfoQ
InfoQ En
InfoQ Jp
InfoQ Fr
InfoQ Br

创作场景

Java 基准所面临的挑战

评论

外贸企业如何搭建适合自己的B2C外贸出口独立站

Tmall API 丨Tmall commodity list data interface丨Tmall commodity details data interface

大型媒体网站霸占86.1% Google首位排名：普通网站如何突围？

Taobao api丨Taobao API interface丨 Taobao product data interface丨Taobao product details interface

Taobao purchasing system丨Taobao purchasing system丨Chinese purchasing system丨Chinese goods purchasing

MySQL运维6-Mycat垂直分库

矩阵起源荣获"深圳企业创新（国际）纪录"殊荣

突破!金淑杰成功研发中空纤维纳滤膜技术,助力全民健康饮水!

外贸各个大洲客户的特点

IPQ6010 vs IPQ9574 Platform Comparison|Achieve 1588 TSN in WiFi6 WiFi7Hardware

4种Python中基于字段的不使用元类的ORM实现方法

MatrixOne 通过中国信通院 “可信数据库” HTAP 基础能力专项测试

测试开发 | AI在人工和服务领域的崭新角色

测试开发 | 智能农业引领农业革新，人工智能携手农业改写未来

聊聊kube-scheduler如何完成调度和调整调度权重

软件测试/测试开发/人工智能丨模型通过什么原理帮助业务解决问题

数云100|神州数码X浙江联通：以算力支撑面向“互联网+”的隐私保护系统，保护用户的隐私数据安全

神州数码（Digital China）与跬智信息（Kyligence）签署合作协议

企业如何通过全面预算管理优化业务流程

Google SEO服务的常见坑人套路

Python在人工智能领域的应用案例分析

Pinduoduo API丨Pinduoduo commodity details data interface丨Pinduoduo commodity data interface

低代码助力全栈开发

软件测试/测试开发/人工智能丨分类，二分类和回归问题的对应场景与区别

多家公司荣获Autodesk Design & Make大中华区杰出贡献奖

交大安泰行研五周年，“第六届中国行业发展高峰论坛”成功举行

前端框架如何帮助开发者构建应用程序？

理解 Paimon changelog producer

手把手入门MO | 如何通过通过 FineBI 实现 MatrixOne 的可视化报表

GO编程语言：简洁、高效、强大的开源编程语言

Curve 文件系统为 AI 业务降本增效

创作场景

Java 基准所面临的挑战

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载