写点什么

UAVStack 功能上新:新增 JVM 监控分析工具

  • 2020-02-06
  • 本文字数:2066 字

    阅读完需:约 7 分钟

UAVStack功能上新:新增JVM监控分析工具

引言

作为 AllInOne 的智能化服务技术栈,UAVStack 提供了非常全面的监控数据采样功能,同时支持数据监控与预警。近期,我们整合了原有的数据采集展示功能,新增 JVM 分析功能,推出了更易用的 JVM 监控分析工具。


熟悉 JDK 的开发者都知道,JDK 本身提供了一套 JVM 分析工具,包括 jinfo、jmap、jstack 等。用户可以通过命令行轻松获取 JVM 内存堆栈信息、内存对象分配以及 JVM 启动基本参数信息。但这些工具需要在命令行环境中执行,且生产环境下则需要通过堡垒机转发。


开源社区一些不错的 JVM 分析工具也可以提供获取 JVM 基本信息、追踪堆栈、获取内存信息等功能,但同样需要命令行 CLI 的支持。


UAVStack 推出的 JVM 监控分析工具提供基于页面的展现方式,以图形化的方式展示采集到的监控数据;同时提供 JVM 基本参数获取、内存 dump、线程分析、内存分配采样和热点方法分析等功能。

一、架构

JVM 监控分析工具基于 UAVStack 既有架构,整体分为前端、后台及中间件增强框架(MOF)。其中:


  • 前端负责展示数据、向后台发送用户执行指令;

  • 后台负责下发指令、响应用户查询、处理采集到的数据;

  • 中间件增强框架(MOF)负责接收后台下发的指令、执行指令并返回数据或将数据写入文件,然后通过 UAV 提供的文件归集功能上送数据。


整体架构流程如下图所示:


1571038341144063667.jpeg

二、关键技术

2.1 JMX

JMX 提供相关接口,获取基础的 JVM 监控数据,如内存堆大小、GC 情况等,是 JVM 监控数据的基础。

2.2 中间件增强框架(MOF)

作为分析工具整条链路的基础,MOF 依附于用户应用,主要提供以下基础支持:


  • 基础数据采集:MOF 植入应用中,JMX 定期获取并上报相关 JVM 的基本信息数据,为展示和预警提供数据基础。

  • 请求捕获、指令执行:JVM 监控分析工具的大多数功能都需要下发指令至应用所在的服务器。MOF 负责把下发指令的请求拦截下来,执行并返回对应的结果。

2.3 Java Attach API

Java Attach API 是由 Sun 提供的一套非标准 API,可以将用户连接到运行中的虚拟机进程上,进行 agent 的挂载等操作。


在 JVM 监控分析工具中,Java Attach API 主要用于 Attach 到虚拟机进程,进行如下操作:


  • 获取 JMX Connection:从外部获取 JVMConnection,得到 MXBean,抓取运行数据。(CPU 采样分析)

  • 获取 VirtualMachine 对象:调用接口,得到堆内存分布信息。(内存采样分析)

三、功能展示

3.1 基本监控

选择应用实例后即可进入基本监控页面。


该页面主要展示 CPU 使用率、线程情况、内存占用和 GC 情况。用户可以根据需求调整时间范围,查看不同时段的监控数据。


1571038365334066717.jpeg

3.2 JVM 摘要

JVM 摘要页面显示当前虚拟机的基本参数信息,包括基本信息、JVM 参数和系统属性。其中:


  • 基本信息包括 pid、主机信息、启动参数以及 JVM 的启动时间等最基本、最重要的信息;

  • JVM 参数包括所有 JVM 启动参数,用户可查看指定的堆大小、垃圾回收器信息等;

  • 系统属性包括写入 System.Properties 中的所有配置信息以及 Javaagent 的配置属性。

1571038383794089716.jpeg

3.3 线程分析

线程分析通过执行 jstack 获取线程基本信息,并对输出结果进行分析,得到线程状态数量、有无死锁等信息。


1571038397964069401.jpeg

3.4 内存 Dump

内存 Dump 通过执行 jmap 获取指定 JVM 的堆栈 dump 文件。


用户可以便捷地在前端一键生成 dump,不需要再登录堡垒机。点击“刷新”可以查看近期 dump 内存的操作记录。


1571038415344045959.jpeg

3.5 CPU 分析

CPU 分析是基于线程栈的采样分析,主要提供两个功能:线程执行时间以及方法热点采样。


  • 线程执行时间是指线程在采样期间的活动时间。查询结果按照线程活动总时间排序,同时提供线程名称和线程执行时间信息,用户可据此判断应用的执行情况。


1571038433124008099.jpeg


  • 方法热点采样统计所有方法的执行时间,提供方法的类名和方法名信息。其中,方法的自用执行时间不包括方法调用其他方法的执行时间。查询结果按照方法的自用执行时间降序排序,用户可以查看当前应用内部耗时较长的执行方法,判断应用是否异常、是否需要优化。

1571038442575082239.jpeg

3.6 内存分析

内存分析是基于线程以及堆的统计采样分析,主要提供两个功能:每个线程的内存分配和堆内分配细节。


  • 线程内存分配提供每个线程的内存分配大小和线程名称等信息,按照内存分配大小降序排列。用户可查看当前占用内存较大的线程。


1571038457865043418.jpeg


  • 堆内分配提供了各个类在堆内的分配实例数以及所占用的堆内存,按照堆内存大小降序排列。用户可把该功能当作简易的 dump 及分析工具,快速分析内存分配情况,发现内存分配问题。

  • 1571038476165072687.jpeg

总结

JVM 监控分析工具是从监控、分析到展示的一体化工具。JDK 自带的工具虽然也可以实现除 CPU 分析之外的其他功能,但不够便捷,也无法实现从采样、分析到图形化展示的一体化效果。JVM 监控分析工具解决了开发人员没有线上应用堡垒机权限、无法分析采集到的数据等痛点,同时提供 CPU 与内存采样分析等功能,以较低的性能开销获取较为全面的 JVM 运行数据,帮助应用开发人员发现与分析问题,为应用开发优化提供参考依据。


UAVStack 已在 Github 上开放源码,并提供了安装部署、架构说明和用户指南等双语文档。


官方网站:https://uavorg.github.io/main/


开源地址:https://github.com/uavorg


本文转载自宜信技术学院网站。


原文链接:http://college.creditease.cn/detail/307


2020-02-06 21:281057

评论

发布
暂无评论
发现更多内容

3D云渲染的优点和缺点是什么?

Finovy Cloud

人工智能LLM模型:奖励模型的训练、PPO 强化学习的训练、RLHF | 社区征文

汀丶人工智能

人工智能 强化学习 RLHF ppo算法 年中技术盘点

云原生网关如何实现安全防护能力

阿里巴巴云原生

阿里云 云原生 网关

直播解锁 Serverless 新进展,与 AIGC 结合有什么搞头?

阿里巴巴云原生

阿里云 Serverless 云原生 AIGC

代码随想录Day20 - 二叉树(六)

jjn0703

再获肯定!柏睿数据通过国家级专精特新“小巨人”企业复核

新消费日报

直播回顾|用户增长之路,如何兼具体验和点击率?

HarmonyOS SDK

HMS Core

直播软件源码开发搭建提高安全性方案——山东布谷科技创作

山东布谷科技

源码 软件 软件开发 直播 源码搭建

简易注册中心监控NAS断电断网

WizInfo

Python

如何使用 Amazon Systems Manager 集中管理 Amazon IoT Greengrass 设备

亚马逊云科技 (Amazon Web Services)

Amazon

香港成新加密中心,JPEX生态平台通证JPC获益颇多

股市老人

计算机视觉和滤帧技术

鲸品堂

计算机视觉 图像 企业号 7 月 PK 榜

百度 APP iOS 端包体积 50M 优化实践 (四) 代码优化

百度Geek说

ios 代码优化 企业号 7 月 PK 榜

自动化接口回归测试神器 AREX 使用初体验

AREX 中文社区

自动化测试 AWS 流量回放

ChatGPT助力DevOps的优势与局限

互联网工科生

DevOps 自动化运维 ChatGPT

TDengine 的查询性能与老牌时序数据库相比如何?来看看

爱倒腾的程序员

数据库

AlienSwap 首期 Launchpad — 偶像女团 NFT+RWA 的创新探索

股市老人

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍| 社区征文

汀丶人工智能

神经网络 Transformer NLP 大模型 BERT 年中技术盘点

C语言实现解一元二次方程

codists

抓住风向“猪”持续飞,还是维持在风向的高度上?

Bonaparte

产品 产品经理 产品需求 产品培训

使用 JavaScript 脚本来进行复杂的查询改写

极限实验室

Java JavaScript

2023-07-17:给定一个数组arr,长度为n, 再给定一个数字k,表示一定要将arr划分成k个集合, 每个数字只能进一个集合。 返回每个集合内部的平均值都累加起来最小的值。 平均值向下取整。 1

福大大架构师每日一题

福大大架构师每日一题

华为云CodeArts Check代码检查新手操作指南

云计算 代码规范 华为云 代码检查

UAVStack功能上新:新增JVM监控分析工具_语言 & 开发_张明明_InfoQ精选文章