2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Alibaba Dragonwell 21 AI 增强版:引爆 Java 在 AI 时代的性能潜能

  • 2025-11-18
    北京
  • 本文字数:4947 字

    阅读完需:约 16 分钟

大小:2.44M时长:14:14
Alibaba Dragonwell 21 AI 增强版:引爆 Java 在 AI 时代的性能潜能

2025 年,Java 迎来了它的 30 岁生日。在这 30 年间,Java 一步步成为了企业级应用中最稳固的基石;而在如今这个 AI 的时代,Java 也开始承担越来越多 AI 相关的重型负载,例如基于 Elasticsearch 的 RAG 引擎、基于 Spark 的大规模数据分析与特征工程等。


然而,面对大规模、计算密集的 AI 应用场景,传统 JVM 往往显得力不从心:Java 层面的向量化能力仍有不足,难以高效实现复杂的并行计算;若转而依赖 native 代码进行向量化改造,则又不得不承受 JNI 带来的调用开销与开发复杂性。与此同时,JVM 在 GC、JIT 编译和运行时等核心模块虽提供了大量可调参数,具备高度的可定制潜力,但参数组合繁多、调优门槛高,使得性能优化成为一项耗时耗力的任务。这些困境凸显了传统 JVM 在 AI 时代所面临的关键矛盾——开发效率与系统性能难以兼得。如何在保持 Java 高生产力优势的同时,突破性能瓶颈,已成为 JVM 技术演进的重要课题。


为了应对这些挑战,JVM 自身也必须进化。随着大语言模型(LLM)等新一代 AI 技术的崛起,AIOps(智能运维)正成为企业 IT 运维的未来。然而,传统 JVM 对 AI 和运维系统来说仍是一个黑盒,其内部状态难以观测,复杂的参数更让自动化调优无从谈起。企业亟需一个更懂 AI、更适应 AIOps 的智能 JVM,它应当具备更强的原生计算加速能力、更深度的运行时洞察力和更高程度的自适应优化能力。只有这样,JVM 才能与 AIOps 平台深度融合,实现智能容量评估、异常根因诊断、性能瓶颈自愈等过去难以想象的运维能力,最终帮助企业在 AI 时代实现开发效率与系统性能的统一。


洞悉于此,阿里云重磅推出 Alibaba Dragonwell 21 AI 增强版,基于 Dragonwell 21 Extended Edition 开发。作为 OpenJDK 的生产级下游发行版,Dragonwell 21 集成了丰富的优化,综合性能领先 OpenJDK 21 一个身位。在此基础上,AI 增强版专为 AI 应用深度优化,致力于解决上述问题,帮助企业客户最大化 Java 应用在 AI 场景下的投资回报率。

三大利器,助力 AI 业务全面提速

Native 加速:为核心 AI 组件注入原生执行效率


传统 JVM 中,频繁执行的 Java 方法会被 JIT 编译成高度优化的机器码,以提升程序性能。但是,JVM 的 JIT 编译器对 CPU 的最新特性(如 AVX-512、AMX 等)缺乏支持,因此在许多计算密集的 AI 场景下无法生成足够高效的代码。另一个致命的问题是 JIT 编译器无法利用 GPU 资源,这在 AI 时代尤为关键。


Alibaba Dragonwell 21 AI 增强版提供了 Native 加速功能,它可将常见 AI 负载中的热点方法,替换为预编译的、极致优化的本地代码实现。这就相当于给 Java 应用的“发动机”换上了 F1 赛车的核心部件,让 JVM 得以在关键链路上发挥出 CPU/GPU 资源的最大潜力。


在当前的大模型浪潮中,检索增强生成(RAG)已成为企业构建智能问答、知识库等应用的核心技术。这类应用通常依赖 Elasticsearch 等向量数据库进行高效检索,其性能直接决定了用户体验。Native 加速功能针对性优化了向量检索中的核心计算环节,能够大幅降低检索延迟,提升 RAG 系统的响应速度。在 GIST 数据集上的测试表明,Elasticsearch 的 max_inner_product 和 BBQ 向量检索端到端性能分别提升了 29.2% 和 18.5%,如下图所示。


同样,在海量数据处理领域,企业需要利用 Spark 等分布式计算框架进行复杂的数据清洗、特征工程和模型训练。这些任务涉及密集的计算和数据交换,每一分性能提升都意味着成本的节约和效率的飞跃。Native 加速功能为 Spark 的核心实现提供了原生代码级别的优化,让 Java 应用也能享受到极致的执行效率,从而加速整个数据处理流程。开启加速后,在 TPC-DS 基准评测中,Spark 4.0 总体性能提升 5.2%,部分关键查询的性能提升甚至超过了 60%,如下图所示。


热代码重排:让 Code Cache 拥有智能


JVM 在运行时,会将 Java 方法 JIT 编译后的代码存放在 Code Cache(代码缓存)中。然而,传统 JVM 只是简单地将编译后的代码按时间顺序紧密放置,因此,热点方法的代码在缓存中很可能是分散的。CPU 在执行代码时,会在 JVM 代码缓存的不同位置反复跳跃,导致 CPU I-Cache(指令缓存)的局部性变差,从而影响性能。


为解决这一问题,Alibaba Dragonwell 21 AI 增强版引入了热代码重排,它的工作模式分为两个阶段:

1. 分析阶段(Training Run):在试运行或灰度环境中,收集 Java 应用中热点方法的执行情况,并通过算法智能分析方法之间的关联;

2. 优化阶段(Production Run):正式部署时,JIT 编译器利用分析阶段的热点信息,将关联性高的方法编译到物理上连续的内存区域,大幅提升 I-Cache 和 I-TLB 的命中率。

传统 JVM 执行大型负载时,CPU 会花费大量时间等待代码和数据。而热代码重排能极大减少 CPU 的“空转”,让算力真正用在刀刃上。如上图所示,启用热代码重排后,JVM 即可自动整理 Code Cache 内存,实现更好的性能表现,尤其是在 Code Cache 使用量较大、业务代码复杂但热点集中的场景下,热代码重排的优化效果更为显著。


在阿里巴巴某大型电商应用测试中,开启热代码重排特性后,在灰度环境中进行 Training Run 采集热点信息,并在正式生产环境中启用 Production Run 实现热代码的集中排布,最终实现 CPU 利用率下降 6.1%、请求 RT(响应时间)下降 8.9% 的优化效果,在降低服务成本的同时提升了用户体验,如下图所示。

JTune:您的专属 JVM 参数调优大师


JVM 参数调优一直都是让人头疼的问题,尤其是 GC 相关的参数。对于一个 Java 应用,往往需要结合应用多次运行的状态,耗费数位精通 JVM 的资深工程师的精力,才能找出一套相对合适的 JVM 参数——这对很多中小型企业而言,几乎是不可能完成的任务。


Alibaba Dragonwell 21 AI 增强版包含了一个重磅工具:JTune。区别于传统的固定规则调优,JTune 内置机器学习模型,可以自动探索 JVM 庞大的参数组合空间,通过“采样-调整-验证”的闭环反馈,为您的特定应用和硬件环境寻找最优的参数配置。

从此,JVM 调优这门“玄学”彻底变成了科学,您不再需要 JVM 专家花费数周进行手动调优,只需执行几行命令,JTune 就能自动完成这项工作。这样不仅省时省力,还往往能找到超越人类专家经验的更优解。


JTune 目前支持智能调整 G1 GC 的 G1NewSizePercent 和 G1MaxNewSizePercent 两项参数,通过控制年轻代比例,在尽可能保持 RT 的情况下,提升吞吐量。除此之外,JTune 还支持根据 GC 行为智能推荐 Java 堆大小,即 -Xmx 参数的值——这一举解决了困扰很多 Java 运维的难题。有了 JTune,您的业务既能运行如飞,也完全不会浪费内存,从而实现了硬件资源的最大化。


在行业权威的 SPECjbb 2015 基准评测中,JTune 展现了其强大实力。如上图所示,启用 AI 调优后,JTune 自动为 JVM 推荐了 G1NewSizePercent=21 和 G1MaxNewSizePercent=51 的最佳组合。最终,关键业务吞吐量(critical-jOPS)提升了 5.0%,最大吞吐量(max-jOPS)提升了 2.3%。这意味着您的应用能够以更低的延迟处理更多的业务请求,直接转化为更高的系统容量和更好的用户体验。

快速上手,生态兼容

适用场景


Alibaba Dragonwell 21 AI 增强版适用于以下场景:

  • AI 向量检索与 RAG 场景:对于构建企业级智能知识库、文档助手、智能问答等 RAG 应用的客户,AI 增强版可组合多种技术,全面提升底层 Elasticsearch 等组件的运行效率。在显著降低检索延迟的同时,提升系统在高并发下的稳定性,确保流畅的用户体验。

  • 大数据分析与特征工程:对于需要处理海量数据、进行复杂特征工程和数据分析的客户,AI 增强版可系统性优化 Spark 等大数据框架的性能瓶颈,帮助您在不改变业务代码的前提下,有效缩短数据处理周期、降低硬件资源消耗。

  • 智驾等大型复杂系统:对于代码库庞大、运行时热点分散的智能驾驶、高清地图等核心系统,AI 增强版能有效优化 Code Cache 效率,降低系统 CPU 开销与响应时间,提升系统整体稳定性。

  • 追求极致运维效率的场景:对于希望降低 JVM 调优成本、提升运维自动化水平的企业,AI 增强版能与 AIOps 体系结合,将 JVM 从一个需要被动调优的黑盒,转变为一个能够主动自省并与外部系统智能交互的运行时,为实现更深层次的自动化性能优化和容量管理提供坚实基础。

使用指南


Alibaba Dragonwell 21 AI 增强版将使用 RPM 包的形式发布,在 Alibaba Cloud Linux 中,您可使用 yum install 命令轻松完成安装操作。


安装后,在 Java 的启动命令行中添加 AI 增强相关的参数,即可开启对应的 AI 增强功能。例如,您希望使用 AI 增强加速 Elasticsearch 8.17,则可添加如下命令行参数:


java -XX:+UnlockExperimentalVMOptions -XX:+UseAIExtension \     -XX:AIExtensionUnit=es_8.17 ...
复制代码


-XX:AIExtensionUnit= 参数可添加多个,以同时开启多个 AI 增强功能。例如,您可以在此基础上继续启用 Spark 4.0 的加速:


java -XX:+UnlockExperimentalVMOptions -XX:+UseAIExtension \     -XX:AIExtensionUnit=es_8.17 -XX:AIExtensionUnit=spark_4.0 ...
复制代码


目前,Dragonwell 21 AI 增强版支持的增强功能如下:

  • es_8.17 :使用 AI 增强加速 Elasticsearch 8.17.x;

  • spark_4.0 :使用 AI 增强加速 Spark 4.0;

  • hotcode_1.0 :开启热代码重排,优化 Code Cache 性能。


JTune 功能为独立的命令行工具,支持在线和离线采集 Java 应用的性能数据并智能分析。因为机器学习算法会占用部分 CPU 资源,我们推荐使用离线方式:

1.通过设置 Java 应用启动参数开启 JFR,或在应用执行过程中使用 jcmd 命令采样;

2.获得 JFR 文件后,执行 jtune output.jfr --feature=G1GC 命令,耐心等待几分钟,即可得到推荐的 GC 参数。


上述 AI 增强功能的详细使用文档、注意事项等,将在 Alibaba Dragonwell 21 AI 增强版正式发布后公开,敬请关注。

兼容性与支持


Alibaba Dragonwell 21 AI 增强版基于 Dragonwell 21 Extended Edition 开发。Dragonwell 21 Extended Edition 为 OpenJDK 21 下游,您可直接使用 AI 增强版运行现有的 JDK 21 应用,无需进行任何代码适配或迁移。


Alibaba Dragonwell 21 AI 增强版提供长期支持(LTS),维护周期和 OpenJDK 保持同步:我们将在每个季度发布更新版本,并保证至少更新至 2029 年 11 月。在此期间阿里云将持续为 Dragonwell 21 提供性能优化和安全性维护服务,您可放心使用。

立足 AI,展望未来


Alibaba Dragonwell 21 AI 增强版通过三大技术利器,为企业客户在 AI 时代提供了极致性能与极致易用的完美结合:Native 加速、热代码重排与 JTune 智能调优,分别从原生算力、执行效率和运行时配置三个层面协同发力,将复杂的性能优化过程化繁为简。您无需深入 JVM 底层,也能轻松驾驭 AI 负载,获得开箱即用的性能跃升。


这些优化能力,均源自阿里巴巴内部海量业务场景的长期技术沉淀与验证。我们将这些经过严苛生产环境考验的技术成果,转化为标准、易用的产品功能对外输出,希望能帮助更多企业客户从容应对 AI 时代的挑战。这仅仅是一个开始,未来,我们计划将 Native 加速扩展至更多主流的 AI 计算框架与核心组件、进一步简化 Code Cache 布局优化的使用流程、引入更先进的 AI 算法来驱动参数自适应调优、输出更多内部优化,持续提升产品的智能化水平与性能表现。


未来,AI 增强版 JVM 将是 AIOps 体系中不可或缺的一环。我们设想的下一代 Java 运行时,将不再是一个被动执行代码的虚拟机,而是一个具备自主感知、决策和优化能力的智能体。Native 加速将不断扩展,覆盖更多主流 AI 框架,为上层应用提供源源不断的算力;热代码重排与 JTune 等技术将深度融合,让 JVM 具备更强的自适应能力,根据实时业务负载自动调整运行时状态,实现“无人驾驶”式的性能优化。最终,一个高度智能化的 JVM 由此诞生:它将能够主动向 AIOps 平台暴露更丰富的运行时信息,协同实现更精准的异常检测、故障定位和容量预测,让 Java 技术栈在 AI 时代持续保有强大的生命力。


Alibaba Dragonwell 21 AI 增强版的首个版本,很快将以“尝鲜版”的形式与大家见面,并在此后随 Dragonwell 正式版同步发布。我们诚邀广大 Java 与 AI 领域的开发者和企业客户下载试用,亲身体验新一代 JVM 为 AI 应用带来的澎湃动力。最后,欢迎钉钉搜索群号 35434688 加入 Dragonwell 客户支持群。期待您的宝贵反馈,让我们共同推动 Java 在 AI 时代持续进化、再创辉煌!

2025-11-18 09:4812

评论

发布
暂无评论

MobSDK 快速集成文档

MobTech袤博科技

Android Studio an'droid

软件测试 | 测试开发 | web自动化测试-执行 JavaScript 脚本

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Mysql 之执行计划

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Web 控件定位与常见操作

测吧(北京)科技有限公司

测试

IaC 存储最佳实践

SEAL安全

DevOps 基础设施 DevSecOps 基础设施即代码 IaC

沉舟侧畔千帆过 | 高德的OceanBase Cloud实践之路

followtry

最佳实践 分布式数据库 数据库迁移 oceanbase

瓜分 28 万现金大奖,Tapdata 数据源 Connector 大赛等你来战!

tapdata

开源 开发者 开源项目 挑战赛

软件测试 | 测试开发 | Web自动化之显式等待与隐式等待

测吧(北京)科技有限公司

软件测试 | 测试开发 | web 控件的交互进阶

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 从几个开源项目浅谈IOS视频流输出方案

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 测试面试真题|从手工到测开,一位测试媛宝妈的 BAT 大厂逆袭之旅

测吧(北京)科技有限公司

测试

百度工程师带你探秘C++内存管理(理论篇)

百度Geek说

c++ Linux 开发语言 企业号九月金秋榜

软件测试 | 测试开发 | JVM内存溢出问题排查

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 如何提取 IOS Document_apis

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 浅谈Shiro框架在Spring Boot中的认证应用

测吧(北京)科技有限公司

测试

Vue3入门指北(四)computed (计算属性)

Augus

Vue 9月月更

Struts 校验器(Validate)

表单校验 Struts2 9月月更

开发者有话说 | 一位工作十余年工程师的成长之路

矜辰所致

个人成长 经历分享 9月月更 成长感悟

如何通过 Nginx 解决跨域问题

观测云

Vue3入门指北(二)创建应用实例

Augus

Vue 9月月更

Vue3入门指北(三)ref和reactive

Augus

Vue 9月月更

软件测试 | 测试开发 | 网页 frame 与多窗口处理

测吧(北京)科技有限公司

测试

点赞破百万!字节算法大佬亲撰30W字数据算法笔记:GitHub标星93K

程序知音

Java 数据结构 数据结构与算法 后端技术

本地生活与小程序技术融合迎战增量市场

Onegun

小程序 小程序容器 本地生活

软件测试 | 测试开发 | 了解磁盘IO的那些事

测吧(北京)科技有限公司

测试

DophineSheduler上下游任务之间动态传参案例及易错点总结

白鲸开源

大数据 DolphinScheduler 任务调度 大数据 开源 参数传递

本周四晚19:00知识赋能第八期第3课丨涂鸦小游戏的实现

OpenHarmony开发者

OpenHarmony

EasyNLP带你实现中英文机器阅读理解

阿里云大数据AI技术

自然语言处理 深度学习 PyTorch 企业号九月金秋榜

heco火币生态链智能合约dapp系统开发案例,合约部署

开发微hkkf5566

软件测试 | 测试开发 | Windows-Python 应用:使用消息操作窗口

测吧(北京)科技有限公司

测试

Alibaba Dragonwell 21 AI 增强版:引爆 Java 在 AI 时代的性能潜能_AI&大模型_阿里云_InfoQ精选文章