2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

DevOps 中如何系统开展微服务性能测试?

  • 2020-03-27
  • 本文字数:1632 字

    阅读完需:约 5 分钟

DevOps中如何系统开展微服务性能测试?

基于 Devops 的微服务架构是云时代部署应用的一项热门技术,它把庞大的单个应用程序分解为数十个微服务,使业务更快速地响应市场变化。但是每个微服务有不同的客户需求并且随着微服务增多,无法做 1:1 验证,传统性能测试模式已不能满足 Devops 平台的要求。 DevOps 中如何系统开展微服务性能测试?

微服务架构下的性能测试挑战

微服务是实现 DevOps 的重要架构

1.微服务 3S 原则



2.DevOps 核心点



  • 亿级用户的平台

  • 单服务业务随时扩容

  • 服务之间存在相互调用关系

  • 版本更新快,上线周期短



单服务流量激增时扩容


调用链条变长,调用关系更加复杂


微服务拆分导致故障点增多


单服务变更性能影响如何评估?


性能瓶颈在各微服务间漂移,如何做好性能测试?


应对突发流量需求,扩容能否解决问题,如何扩容?


服务实例数量众多,如何收集信息,快速定位性能问题?

微服务性能保障解决方案设计



•关键设计 1:模块化管理,事务灵活组合与复用



关键设计 2:应用与资源一体化编排


性能测试实施策略

  • 单服务接口测试(契约)

  • 验证单服务的各个接口能力基线以及组合接口的能力基线,服务间遵循契约化原则,大部分问题屏蔽在集成之前

  • 全链路测试(SLA)

  • 验证整个系统之上全链路场景以及多链路组合场景的性能,优化链路中性能不足的服务

  • 伸缩能力验证(面向现网运维)

  • 验证单服务的水平扩容能力,验证既定模型下的多链路组合场景的资源模型


在微服务架构下,自动化仍然是提升效率,看护质量的重要手段,每个微服务独立快速迭代上线,更加要求微服务的性能不劣化。




  • 存在部分响应超时:

  • a) 服务器繁忙,如某个服务节点 CPU 利用率高

  • b) 网络 IO 超过 VM/EIP 带宽

  • c) 等待后端微服务、数据库的超时时间设置过长

  • TPS 未随着并发数增长而上升:

  • a) 系统性能到达瓶颈,持续并发加压过程中响应时延增加(可观察响应区间统计)

  • b) 可通过进一步加压是否会出现非正常响应验证

  • 运行一段时间后全部响应超时或者检查点校验不通过:

  • a) 大压力导致系统中某个微服务奔溃

  • b) 后端数据库无响应

  • TP90 响应时延较短,TP99 时延高:

  • a) 系统性能接近瓶颈

  • b) 可通过进一步加压是否会出现非正常响应验证


  1. 扩容:链路中的某一应用可能出现 cpu 使用率较高或者连接池资源不够用(rpc、jdbc、redis 连接池等)但本身对于拿到连接的请求处理又很快,这一类需要横向扩展资源。

  2. 应用逻辑优化:比如存在慢 sql、逻辑的不合理如调用 db 或者 redis 次数过多、没有做读写分离造成写库压力过大。

  3. 超时时间的合理设置:对于应用之间的 rpc 调用或者应用与其他基础组件之间的调用,均需要设置合理的超时时间,否则过长的等待将造成整个链路的故

  4. 缓存的应用:请求尽可能从前端返回,而不是每一个都要让后端应用处理后再返回,减轻后端应用及数据库压力,提高系统吞吐能力。

  5. 限流:对于超出承载能力的 QPS 或并发,可以进行拦截并直接返回提示页面。

  6. 降级:对于非核心链路上的应用,允许故障关闭而不影响核心链路。

典型互联网平台的全链路分段压测

一个典型的互联网平台:突发事件高流量突发,如瞬间由百级用户增长到万级



对于网络架构复杂的应用,可以拆分压力的入口点,进行分段验证,屏蔽对应网元带来的性能影响,如分别从最外端的 CDN 入口(1)、中间的 ELB(2)、业务层(3)分别做测试,验证复杂网络架构情况下,各网元的瓶颈和影响,系统内部的性能瓶颈如何提升定位效率?

APM 调用链跟踪解决问题定位最后一公里

在上线和活动前期通过云性能测试服务进行压力测试,发现部分接口的响应时间比较长,会出现比对失败和响应超时,通过 APM 的调用链分析,发现有部分 SQL 语句比较耗时,针对这些 SQL 查询语句,建立了索引,快速定位问题并迅速解决。


最终经过两轮测试优化后,官网首页访问响应超时与正常返回比提升了 43.3%,预约试驾场景响应超时与正常返回比降低到 0,提升了 100%。


性能瓶颈定位时间,从官网未使用 APM 时需要 1 周,缩短到俱乐部使用 APM 后的 0.5 天,效率提升 90%。


  • 资源分析:

  • 调用链分析:


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/WR5YePZeyvaMJu8-LVxCJQ


2020-03-27 22:043125

评论

发布
暂无评论
发现更多内容

spring boot 自动装配原理详解

公众号:程序猿成神之路

Spring Boot

我是一个请求,我该何去何从

华为云开发者联盟

CSE 请求 条件 Verticle Route

深入了解Spring之事件机制

邱学喆

观察者模式 spring的事件机制 EventListener注解

十亿级流量下,我与Redis时延小突刺的战斗史

vivo互联网技术

redis Jedis 调用链 流量防控

降低网络AI应用开发门槛,AIOps两大部署模式来助力

华为云开发者联盟

运维 RPA 自动化 AIOPS 华为云AIOps

Python——有序字典 (OrderedDict)

在即

6月日更

喜讯 | 拍乐云荣膺「全球云计算大会“云鼎奖”」,先进技术受业界肯定

拍乐云Pano

技术生态两手抓,打造面向未来的企业级领先数据库

华为云开发者联盟

数据库 开源 云原生 华为云 GaussDB

PornNet:色情视频内容识别网络

百度Geek说

云计算 大数据 后端 图像识别

2021年5月券商App行情刷新及交易体验评测报告

博睿数据

博睿数据 券商App 性能评测

【Vue2.x 源码学习】第二十一篇 - 依赖收集的过程分析

Brave

源码 vue2 6月日更

校友会小程序开发笔记十: 校友资讯功能模块设计与实现

CC同学

校友录小程序 同学录小程序

都有哪些较好用的项目管理软件?

万事ONES

项目管理 研发管理 ONES 研发工具

JAVA面向对象(九)--继承

加百利

6月日更

从Linux零基础小白到Linux云计算架构师的成长之路!

学神来啦

Linux 运维 运维自动化

在线时间戳格式化转换工具【推荐】

入门小站

工具

打造一个通用、可配置、多句柄的数据上报 SDK

魅影

sqlite 数据库 APM 多线程 数据上报

EasyRecovery---视频文件恢复技巧

淋雨

数据恢复 EasyRecovery 文件恢复 免费恢复软件 硬盘数据恢复

ONES x 知名车企 | 软硬件研发项目管理实践

万事ONES

项目管理 研发管理 ONES

HarmonyOS学习路之开发篇——Intent

爱吃土豆丝的打工人

HarmonyOS Ability intent 页面跳转

公安局指挥中心一体化管理系统,情指勤合成作战

技术部门Leader:如何平衡技术能力与项目管理能力?

万事ONES

项目管理 研发管理 技术管理 ONES

【21-14】singularity介绍

耳东@Erdong

6月日更 singularity

Linux之rm命令

入门小站

Linux

算法:八皇后问题

看山

面试 算法 6月日更

react源码解析17.context

全栈潇晨

React

浪潮云说丨构建实时监控能力,提升应用质效

云计算

App 上架包预检

魅影

ios Node 代码扫描 脚本 应用审核

校友会小程序开发笔记九: 校友群助手功能模块设计与实现

CC同学

校友会小程序 同学录小程序

校友会小程序开发笔记十一: 后台管理系统功能设计与实现

CC同学

校友录小程序 同学录小程序

我的小程序开源啦~

悟空聊架构

小程序 刷题 SpringCloud passjava 6月日更

DevOps中如何系统开展微服务性能测试?_DevOps & 平台工程_华为云产品与解决方案_InfoQ精选文章