GMTC 全球大前端技术大会(北京站)门票 9 折特惠中,点击立减 ¥480 了解详情
写点什么

KonaJDK 赋能云上 Java 新生态

2020 年 12 月 08 日

KonaJDK 赋能云上 Java 新生态

一、自研 KonaJDK 对于云 Java 生态的意义


JDK 作为 Java 应用的基础设施,在云 Java 生态上的重要性不言而喻。KonaJDK 作为 Tencent 自研 JDK, 已经平稳支撑于腾讯云微服务,消息中间件,大数据等核心业务,同时在信创等场景上作为 Java 业务的基础支撑组件,填补了腾讯云信创场景下 JDK 组件的空白。本文将主要从 KonaJDK 在信创云环境支撑,KonaJDK 支持腾讯云产品的能力拓展与定制化以及 KonaJDK 在大数据场景的优化实践几个方面,介绍 KonaJDK 对于腾讯云 Java 业务的支撑与优化。


二、KonaJDK 信创环境支撑


信创云环境中 Java 业务要求 JDK 能够稳定高效的支撑国产 CPU 运行环境。其中主要的 CPU 指令集为 aarch64。通过我们调研,目前 JDK8 在 aarch64 指令集的情况如下:


  • OpenJDK


OpenJDK8 在主线分支中并没有 aarch64 指令集的支持,网上能够找到的开源版本,都是开源社区几个主要参与者贡献的。对于腾讯云业务来说,开源版本并没有在生产系统中得到验证,也没有专门的人力进行代码的维护与更新。所以在可维护性,安全性及稳定性上都存在风险。


  • OracleJDK


OracleJDK 8 之中包含 AARCH64 支持。但考虑到成本,以及 OracleJDK 8 代码未开源,问题定位等方面的难度。同时,我们在特定场景下也发现 OracleJDK 频繁的 ForceSafepoint 可能对业务稳定性存在影响,所以我们也没有考虑使用 OracleJDK 8 作为 AARCH64 的首选 JDK。(具体可以参见文章:  <不要再乱下载JDK了:Elasticsearch在国产化ARM环境下的首个大坑>


经过一系列的分析,我们最终选定 KonaJDK 作为腾讯云信创方案的首选 JDK,主要原因如下:


KonaJDK 的 AARCH64 版本基于 OpenJDK 社区最受欢迎的 IcedTea 项目,之后经过 KonaJDK 大量的研发,适配与修正。在稳定性方面经过了大规模生产环境的测试与验证,并且通过了专有云等产品的质量验收。同时,腾讯内部 Tencent JDK 协同团队可以持续为 KonaJDK 提供版本维护与技术支持。


总而言之,腾讯 KonaJDK 能够在保证正确性稳定性的同时,提供 JDK 的维护,技术支持,优化以及定制化功能等方面的支持,更适合信创环境下云业务的场景。


三、KonaJDK 支持云产品能力拓展与定制化


除了稳定支撑信创云 Java 业务外, KonaJDK 在其可定制性方面也为云业务提供了多方面的支持。我们主要通过以下几方面进行说明:


1. 微服务产品中 JVM 监控诊断能力提升


根据统计,大约 60% 的云业务开发者使用 Java 语言。以腾讯云微服务管理平台(TSF)为例,其业务支撑环境,以及用户部署的微服务,主要是使用 Java spring cloud 框架实现的,即这些业务都是运行在 JDK 环境中的。但在实际使用过程中,用户更加关注的是业务的功能与实现,很难感受到 JDK 在其中的作用。作为对比,下图是云业务开发者眼中的微服务,用户更加关注微服务每个模块的功能,以及微服务业务的功能。



下图是 JVM/JDK 研发者眼中的微服务:



可以看到,基本上每一个微服务功能节点都是一个 JVM 实例。因此如何通过 JVM 侧信息帮助开发者了解自己的云业务运行情况,是云支撑平台类产品的关键功能。


目前,腾讯云微服务产品 TSF,消息中间件产品支撑环境已经使用 KonaJDK 作为业务支撑组件。除了支持标准 JMXbean,兼容开源 JVM 相关 profiler 来提供微服务基本 JVM 监控信息外, KonaJDK 还从以下方面进行相关提升(部分功能研发上线中)


  • JFR (Java Flight Recorder)


JVM 内置轻量级 Profiler,可收集 Java 应用在运行过程中的诊断及性能数据,back port 自 OpenJDK11。如果使用的是默认的配置,理论上 JFR 开销是小于 2% 的,因此必要情况下可用在现网收集数据。KonaJDK 中针对 JFR 做了大量的问题修复与能力提升,目前可以在运行时动态打开、关闭。采集到的数据在内部可以通过 KonaProfiler 进行分析


  • KonaProfiler


KonaJDK 团队研发的一款线上综合性 JVM 性能分析工具,目前支持 JFR 数据文件的分析,heap dump 数据分析,jstack 数据分析,火焰图等多种功能。


例 – KonaProfiler 支持多种类型火焰图分析




例 – KonaProfiler 对于 JFR 数据分析给出分析建议



结合以上能力,在 KonaJDK 的加持下,腾讯云微服务平台可以为用户提供 JVM 监控,线上诊断等一系列能力,满足用户在性能分析及调优方面的需求。


2. 国密算法的支持


随着国密算法等商密算法国家标准的推出,云上客户对于 Java 版本的国密算法需求越来越多。经过调研与客户反馈,我们发现目前在国密算法的使用上,主要存在以下几类问题:


  • 使用成本高


客户在一些场景上需要国密算法, 但是受各种原因限制,客户不可能也不愿意自身研发国密算法。


目前网上国密算法的实现参差不齐,以下是我们在主流搜索引擎上搜索“国密算法 Java 实现”。



从结果可以看到大部分内容都是个人爱好者的实现,或者使用开源项目。这些项目每种实现都需要学习 API 的使用,并且如何选择合适的项目,也是客户面临的成本问题。


  • 可靠性存疑


另外一点在于可靠性上, 在一些场景上,对于国密算法的要求处理功能正确与性能优秀以外,还需要可靠性保证。例如是否符合国标,是否经过认证等等。


KonaJDK 团队经过调研,实际上在 Java 密码算法的使用上,最为普及,也最为易用的实现就是 Java Cryptography Architecture(JCA), 使用 JCA 定义的 Cipher 类与 API,可以高效,便捷的使用 JDK 中实现了 JCA 的密码算法。


KonaJDK 团队经过与内部密码专家团队的合作,共同开发了基于 JCA 的国密算法 SM2, SM3,SM4 支持,其主要具备以下优点:


  • 简单易用, 国密算法使用符合标准 JCA 调用流程,开发人员在掌握 JCA 的基础上,只需要简单学习几个基本要点就可以顺利使用。

  • 安全可靠,由腾讯内部专业密码专家团队开发维护,国密算法符合国标。

  • 易于迁移,从其他 JCA 密码算法迁移到 SM 算法只需要简单的替换即可,如下图为从 RSA 切换为 SM2 算法的代码改动,最少仅需 3 行代码变动即可完成。



通过国密算法, 我们可以看到 KonaJDK 提供的定制化能力与技术支持能力能够进一步提升云上产品的能力,方便客户,提高产品价值


3. 工具优化,大堆场景下 Jmap 扫描速度的提升,回馈社区


提到 Java 堆分析,相信很多 Java 程序员最先想起的就是 Jmap。作为 JDK 内置的堆内存分析工具,Jmap 可以实现 jvm 堆内存的统计与 dump 功能。在实际使用中,我们发现在大数据等大堆场景下, jmap 的一次使用要消耗很长时间。而由于 jmap 在运行过程中需要暂停 Java 业务线程,所以可能会出现一次 jmap 发生导致 Java 进程无响应,从而主备结点切换,最终造成业务系统抖动。


经过问题的分析, 我们在 KonaJDK 中引入了 Jmap 的并行堆扫描,如图所示:



通过并行堆扫描与 thread local 数据存储,我们将 Jmap histo 工作时间提升了 6-10 倍,缓解了业务抖动问题。


同时作为 openJDK 社区的参与者,我们将并行堆扫描这个特性积极贡献给了 OpenJDK 社区,目前针对 G1, ZGC, shenandoahGC 的 patch 已经合入 jdk16 主线,而针对 ParallelScavenge 堆的 patch 也已经经过多轮 review,正待合入。


四、Kona JDK 性能保证 - 大数据线上优化实践


除了以上几方面,腾讯 KonaJDK 专家团队针对大数据业务进行了性能的专项提升。例如,通过 GC 调度等优化,大幅降低生产环境 CPU 利用率; 优化 GC 物理内存回收算法,以减少进程物理内存占用; G1 和 ZGC 等 GC 算法持续优化以提升稳定性和减少毛刺等。经过大数据生产环境大规模实际部署验证,和社区版本对比,Kona JDK 在 CPU 使用率和物理内存使用等方面都有明显优势。


五、总结


在过去的 1 年中,KonaJDK 逐步崭露头角,帮助云业务在产品能力,稳定性与性能等方方面面进行了整体的提升。作为 OpenJDK 开源社区的一员,KonaJDK 团队积极参与社区,贡献社区,在刚刚发布的 JDK15 中,腾讯成为国内厂商历史首次 Notable 贡献者,全球贡献第五。


Tencent 在 JDK15 中全球贡献第五


在未来,我们会更加努力,让 KonaJDK 更好的服务于腾讯云,更好的服务于云上 Java 客户,在信创支持、稳定性、性能等方面提升云产品的价值。


头图:Unsplash

作者:孙宇,臧琳

原文KonaJDK赋能云上Java新生态

来源:腾讯云中间件 - 微信公众号

转载:著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


2020 年 12 月 08 日 23:55906

评论

发布
暂无评论
发现更多内容

白话讲解:消息队列到底解决了什么问题?

博文视点Broadview

读书笔记 分布式 RocketMQ 中间件 消息队列

艺术与科技的碰撞!Tristan Easton携手英特尔为漫威粉丝带来十代酷睿《复联》收藏版

最新动态

Nginx配置80端口用于多个域名

石云升

nginx 域名配置 80端口共用

linux入门系列2--CentOs图形界面操作及目录结构

黑马腾云

Linux centos7 操作系统 系统运维

对于一款软件而言,完备的功能固然重要,但交互体验也不该被忽视

Learun

Java 敏捷开发 快速开发 .net core

为什么越来越多的非计算机领域企业,在自主做软件时都选择使用快速开发工具?

Learun

Java 敏捷开发 快速开发 .net core

不懂 ZooKeeper?没关系,这一篇给你讲的明明白白

海星

Java zookeeper 分布式

当代一线城市年轻人生活工作实录(蓝领打工仔篇)

Philips

Java .net 敏捷开发 快速开发 MES系统

《漫威复联》PC版游戏即将登陆,英特尔为其独家 CPU 合作伙伴

最新动态

Kotlin这么火!如何快速从Java过渡到Kotlin

华章IT

Java kotlin 协程 安卓

Linux入门系列1--环境准备及Linux安装

黑马腾云

Linux centos 运维 操作系统

linux入门系列3--常见的linux远程登陆管理工具

黑马腾云

Linux xshell securecrt putty finallshell

linux入门系列4--vi/vim编辑器

黑马腾云

vim Linux centos7 操作系统 VI

C++ 互斥锁和条件变量的性能比较

小林coding

c c++ 编程 并发编程

为什么越来越多的非计算机领域企业,在自主做软件时都选择使用快速开发工具?

Philips

Java 敏捷开发 快速开发 .net core

CentOS 7 配置Supervisor 服务遇到的坑总结

BigYoung

centos 报错 Supervisor

linux入门系列5--新手必会的linux命令

黑马腾云

Linux centos7 Shell linux命令 linux操作

高并发,你真的了解吗?

华为云开发者社区

负载均衡 软件 高并发 操作系统 服务器集群

lgloo Software 的 Jira Cloud 转型之旅

Atlassian

项目管理 DevOps 敏捷开发 Jira Cloud

「分布式一致性协议」从2PC、3PC、Paxos到 ZAB

海星

十年磨一剑-BIGO全球音视频技术解决方案

InfoQ_3597a20b53cc

人工智能 大数据 技术

Windows AD巡检报错处理

BigYoung

windows AD 报错 巡检

吐血整理Windows电脑入侵自检大全

BigYoung

黑客 windows 日志 异常 自检

对于一款软件而言,完备的功能固然重要,但交互体验也不该被忽视

Philips

Java 敏捷开发 UI .net core 交互设计

当代一线城市年轻人工作生活实录(HR篇)

Philips

Java 敏捷开发 快速开发 .net core

初识WebRTC

soolaugust

WebRTC

当代一线城市年轻人工作生活实录(HR篇)

Learun

Java 敏捷开发 快速开发 .net core

话题讨论 | 特斯拉和拼多多杠上了,你有什么看法?

InfoQ写作平台官方

写作平台 话题讨论

Django2.x中url路由的path()与re_path()参数解释

BigYoung

django path url re_path 参数

LeetCode题解:88. 合并两个有序数组,双指针+从后往前,JavaScript,详细注释

Lee Chen

LeetCode 前端进阶训练营

低/零代码平台的优点有哪些?

代码制造者

编程语言 低代码 零代码 信息化 编程开发

DIY 的 Kubernetes 集群的稳定性保障实践

DIY 的 Kubernetes 集群的稳定性保障实践

KonaJDK 赋能云上 Java 新生态-InfoQ