10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

从责任界定和问题预警角度 解读全栈溯源对 DevOps 的价值

  • 2017-06-04
  • 本文字数:1859 字

    阅读完需:约 6 分钟

在 2000 年及更早的时候,应用大都是简单的 3 层架构,即界面层、业务逻辑层和数据访问层。而随着云技术和移动互联网的发展,时代对 IT 技术提出了更高的要求,它需要适应更迅捷的变化。同时,产品的迭代速度和效率变得更快,应用的复杂性也发生了爆炸式的增长,新时代的应用也变得更加难于管理。

Gartner 在 2016 年,对 APM 重新规划了标准,即需要满足数字化体验监控,应用发现、深入追踪与诊断 (ADTD) ,应用分析 (AA) 这三个条件才能称作真正的 APM。在这组概念中,Gartner 认为 APM 的核心功能则是能够基于应用去做问题的发现与诊断。

应用环境日渐复杂 APM 监测面临全新挑战

随着容器、微服务、DevOps、移动化、敏捷开发的迅速普及,如何基于应用迅速发现问题、诊断问题亦迫在眉睫:

  • 容器,微服务的出现,将应用割离的更加“破碎”,“拼接”起完整的应用成了一件不容易的事情;
  • 新架构、新技术使得应用变得错综复杂,应用之间的关系也变得“扑朔迷离”;
  • 全方位监控的要求,令现在只能监控到 30% 用户问题的传统监控方案捉襟见肘;
  • 用户对性能的要求逐渐转移到用户体验方面,这使的 IT 部门更加头痛不已;
  • 而 DevOps、敏捷开发也对快速发现应用性能问题提出了更高的要求。

从用户体验出发 听云全栈溯源全面升级

在此情况下,企业需要一个能够对应用性能进行更加全面有效的监控,在现有复杂多变的条件下迅速找到用户性能问题源头的解决方案,以应对新时代的挑战。

为了能够帮助 DevOps 快速实现不同业务逻辑下的性能排障,国内领先的应用性能管理服务提供商听云推出了全栈溯源解决方案,在国内首次实现了全端、跨应用监控。2017 年,定位问题变得更加复杂,为了能够对应用性能问题更加深入的追踪与诊断,听云从用户体验出发,全栈溯源进行了全面升级。

全新升级的全栈溯源可以实现四大功能:

  • APP 端事务请求全栈溯源
  • 浏览器页面事务请求全栈溯源
  • 拨测事务请求全栈溯源
  • 单用户全栈溯源

量化用户感知 听云 APM 设置用户体验机制

用户体验很难单方面感知和鉴定,听云通过设置用户体验机制,帮助用户达到更好的体验效果。首先,听云通过多方数据收集、反馈与衡量,设置一个默认标准,用户也可以结合自身需求进行自定义,比如自定义网页反应快慢的时间或者指标,或者针对某一条请求或者某一步骤流程做监控。

用户感知层面,比如首屏时间指标、点击控件的时间等,听云将关联相应请求,发现反馈是否由于请求慢所造成的体验不好。举个例子,可能在后台监控程序中,某一页面打开是很慢的,但是在用户体验层面是感觉不到慢,所以听云设置首屏时间的概念,因为首屏慢是用户能够真实体验到的,这种情况就可以基于慢首屏来做全栈溯源。

清晰责任界定 全栈溯源对 DevOps 的价值

在过去,用户投诉流程是客服部门接到投诉,将问题反馈给产品部门,产品部门使用排除法对各环节进行逐一排查,这样的做法效率极低,听云产品副总裁 Moca 表示,全新的 APM 监测平台,是当用户投诉后,后台人员打开控制台,输入用户 ID,后台直接显示问题,然后反馈给研发或运维人员去解决,这样会减少很多不必要的流程。总体而言,听云全新的全栈溯源解决方案会帮助 DevOps 实现清晰责任界定与严重问题自动预警,提升问题反馈效率与查找速度。

1、清晰责任界定:可以为各部门提供统一的信息平台,共同讨论目前应用发生的问题,以及解决方案。

  • 监控:应用的用户体验细节指标,包括用户前端响应时间、网络响应指标细节,以及后端各 API 接口,每个服务的健康状况,识别每条性能曲线上是否存在突发点。
  • 问题定位:隔离用户的问题,界定问题发生的位置,判定是前端还是后端或者是网络的问题,甚至是数据库问题,并且将以业务部门看懂的方式在平台上以可视化的图表展示出来。
  • 解决:直接在平台报表里找到根本原因,无论是某个程序的某段代码,或者是相关的 SQL 语句,还是 DNS 解析异常,甚至是前端图片的异常加载,这些无需专业人员来操作,就能够以简单明白的报表的方式,展示给各个部门,从而容易直接处理。

2、预警:严重问题自动响应

以往,当遇到客户投诉到判断问题发生、运维研发借入直到最终解决,往往要经历至少一周以上的时间,甚至可能是数星期。听云全栈溯源是基于客户关键业务的自动质量控制平台,将把以周为单位的解决问题时间缩短为几分钟,同时预警功能可以对严重问题进行自动响应,在解决客户抱怨问题时,也能成为技术部门最可靠的数据来源。

此次听云产品升级将过去每个端特有的监控产品,整合、优化成一种解决方案,新的全栈溯源解决方案以用户体验为主导,基于能够更好满足当前用户需求的 IT 运维模式,帮助传统企业更加轻松的实现数字化转型。

2017-06-04 19:0012789
用户头像

发布了 24 篇内容, 共 11.8 次阅读, 收获喜欢 2 次。

关注

评论

发布
暂无评论
发现更多内容

Java 18开发者新特性详解:简易Web服务器、代码片段标注与UTF-8默认编码

qife122

Java 新特性

自控学习历程系列 设备的一生

万里无云万里天

自动化 工厂运维

自控学习历程系列 职业等级 电工中级

万里无云万里天

自动化 工厂运维

自控学习历程系列 职业等级 电工高级

万里无云万里天

自动化 工厂运维

自控学习历程系列 低压电工经验总结(6)

万里无云万里天

工厂运维

AI编程实战|提示词工程-N-Shot学习与实践

Jxin

编程 AI 提示词 AI辅助编程

自控学习历程系列 职业等级 电气设备安装工中级

万里无云万里天

自动化 工厂运维

自控学习历程系列 职称 自动控制助理工程师

万里无云万里天

自动化 工厂运维

自控学习历程系列 低压电工经验总结(5)

万里无云万里天

工厂运维

Gemma 3:单GPU/TPU可运行的最强开源模型

qife122

开源技术 AI模型

自控学习历程系列 低压电工经验总结(3)

万里无云万里天

工厂运维

自控学习历程系列 低压电工经验总结(7)

万里无云万里天

工厂运维

自然语言处理现状与未来展望

qife122

自然语言处理 文本摘要

Mac下Elasticsearch7.x安装及Springboot集成

程序员架构进阶

elasticsearch #架构 8月月更 检索引擎 RAG 框架

微软漏洞赏金计划丰收季:六大安全研究员获嘉奖

qife122

漏洞赏金 IE11漏洞

AI 编程实战|提示词工程-COT&TOT学习与实践

Jxin

编程 AI 提示词 提示词工程 AI辅助编程

javax.security.auth.login.LoginException: Receive timed out

刘大猫

人工智能 数据挖掘 算法 数据分析 LoginException

生成对抗网络(GAN)在音乐创作中的实践应用

qife122

生成对抗网络 AI音乐生成

自控学习历程系列 低压电工

万里无云万里天

自动化 工厂运维

视频分割技术:方法、挑战与应用

qife122

深度学习 计算机视觉

自控学习历程系列 低压电工经验总结(4)

万里无云万里天

合规部署大语言模型:AI编排与可解释性

qife122

金融服务 合规

AI 编程实战|提示词工程-Reflexion反思机制学习与实践

Jxin

编程 AI 提示词 提示词工程 AI辅助编程

如何安全使用localStorage保护敏感数据

qife122

数据加密 前端安全

微软Office代码执行漏洞分析(CVE-2021-38646):深入Borland数据库引擎的漏洞挖掘

qife122

漏洞挖掘 模糊测试

自控学习历程系列 多看顶尖工程师的作品,优化自己的思维模式

万里无云万里天

自动化 工厂运维

使用Rust操作Windows ACL:windows-acl库简介

qife122

rust acl

警惕供应链风险:Cybercheck指南助力网络安全防护

qife122

风险评估 供应链安全

自控学习历程系列 低压电工经验总结(1)

万里无云万里天

工厂运维

基于YOLOv8的矿井内煤炭图像智能识别|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

申公豹

人工智能

自控学习历程系列 软考 网络管理员

万里无云万里天

自动化 工厂运维

从责任界定和问题预警角度 解读全栈溯源对DevOps的价值_DevOps & 平台工程_江柳_InfoQ精选文章