OceaBase开发者大会落地上海!4月20日共同探索数据库前沿趋势!报名戳 了解详情
写点什么

SQL Server 大负载的生产环境下的性能优化:初识元数据优化

  • 2011-12-21
  • 本文字数:4426 字

    阅读完需:约 15 分钟

相信朋友对 SQL Server 性能调优相关的知识或多或少都有一些了解。虽然说现在 NOSQL 相关的技术非常的火热,但是 RMDB(关系型数据库) 与 NOSQL 是并存的,并且适用在各种的项目中。在一般的企业级开发中,主要还是 RMDB 占据主导地位。并且在互联网项目中,也不是摒弃了 RMDB,例如 MySQL 就在很多的互联网应用中发挥着作用。所以,对数据库的调优是个值得深入学习的课题。本系列文章,主要讲述与 SQL Server 相关的调优知识,希望能够为朋友们带来一些帮助。

本篇提纲如下:

  • 传统 SQL Server 调优方式的比较
  • 什么是 DMV
  • DMV 简单示例
  • DMV 可以解决哪些问题

传统 SQL Server 调优方式的比较

我们平时可以采用很多工具对 SQL Server 的性能进行诊断分析与调优:性能计数器,SQL Server Profiler 和 Database Engine Tuning Advisor(数据库引擎优化顾问,简称 DTA)。下面我们就来对每一个简单的说明一下,并且讲述各自的优缺点。

性能计数器

对于使用 Windows 操作系统的开发朋友,对性能计数器已经不陌生了,最简单的方式就是运行”perfmon”,就可以打开性能监视器的窗口,然后添加对应的计数器,进行监控。如下图所示:

性能计数器每隔一段时间就回去收集相关的数据,并且我们还可以把这些数据保存起来,便于以后的分析。

优点:使用方便,并且数据收集的比较全面。因为这些操作系统是集成的,不需要额外的花费,就可以直接使用。

缺点:数据不够准确,分析数据成本很高,并且对系统的性能产生影响。因为性能计数器在收集数据的时候,要定时的去抓取系统相关的数据,这样,会对性能造成影响,如果抓取的时间间隔越短,那么对系统的影响就越大。另外,对于收集到的数据,也需要有经验丰富的人去分析数据,并且如果要准确的分析出结果,需要收集大量的数据,人力和时间的成本也高。

SQL Server Profiler

每次谈到 SQL Server 调优,势必要讲到 SQL Server Profiler(为了后续的讲述方便,我们将会把它简称为 Profiler)。使用 Profiler 能够捕获一段时间内 SQL 执行的每个查询的记录。当数据库服务器上有大量很少运行的查询时,或者有特别的用户查询运行的时候,这个工具很有用。使用 Profiler 还能捕获到指定时间段内的工作负荷,然后可以在恢复的数据库系统中进行重现。

下面就是一个使用 Profiler 的界面:

在使用 Profiler 的时候,在哪里启动 Profiler 以及将跟踪的数据保存在何处,是一个特别需要考虑的问题。下面,我们就用来对比地看看各种不同的情况。

启动 Profiler 的位置

跟踪文件

说明

在正在监视的数据库服务器上启动 Profiler 的跟踪

将跟踪的数据文件保存到服务器的文件系统或共享目录中

优点:这种方式适用于非生产环境和低负载服务器上的开发和对数据库应用进行性能诊断和跟踪。

缺点:加大了服务器的 I/O 读写操作

在本机开启 Profiler,连接远程的数据库服务器

将跟踪的数据文件保存在本地

优点:减小了数据库服务器的 I/O 操作。

缺点:加大了网络传输的压力,占用数据库服务器的网络资源和 CPU 资源。因为需要将大量的跟踪数据传送到本机,这样占用了网络资源;而数据在传输的时候,需要 CPU 将之序列化,加大了 CPU 的操作。

数据库引擎优化顾问(DTA)

DTA 一般需要和 Sql Server Profiler 结合在一起使用。DTA 主要是对 Profiler 中收集到的数据进行纯数据的综合分析,所以它分析结果的准确性非常依赖于 Profiler 收集的数据量的多少。Profiler 收集的数据越多,那么 DTA 分析的就越准确,但是这样也对数据库服务器的压力越大,反之。所以,一般不建议在大负载或者生产环境下的数据库服务器上面采用。

如果有需要在大负载,或者生产环境下对数据库的性能进行分析与调优,那如何处理?

这就是我们本次系列文章要讨论的话题。

什么是 DMV

使用过 SQL Server 的朋友,对 DMV(Dynamic Management Views,动态管理视图)或多或少都有一些了解或者耳闻。其实 DMV 就是 SQL Server 内核的元数据,通过对内部的元数据的分析,我们快速而准确获取很多与 SQL Server 内部相关的信息,从而进行性能分析。

当查询在 SQL Server 中运行时,SQL Server 会自动的将此次活动的相关信息记录下来,并且保存在内存之中,这些活动信息,就称之为:DMV。

不同类型的 DMV 信息,有不同的用途,例如,可以相关的 DMV 来对性能进行诊断,从而提升性能,或对数据库的运行进行监控,或解决故障等。

DMV 是以 SQL Server 实例为级别进行保存的。也就说,如果在服务器上面,安装了一个 SQL Server,那么此时这个 SQL Server 就是一个实例,那么这个实例里面的所有的数据库的 DMV 都是保存在相同的内存中。当然,我们在使用的时候,可以根据需要只提取更低级别的 DMV,例如提取某个数据库的 DMV,某个表的 DMV,甚至是某个查询的 DMV。

因为 DMV 信息是保存在内存中的,我们不需要额外的操作,只需要将这些信息取出来,按照我们的要求进行运算,统计,分析就够了,获取信息的数据非常快,并且不会对服务器产生压力。另外,因为 DMV 是 SQL Server 本身保存的,并且已经做了统计的信息,所以,数据更加的接近于数据库本身的状态。

SQL Server 运行的时候越长,DMV 中保存的信息就越多(当然,DMV 非常小,不会对内存造成压力),利用 DMV 分析就越准确。这一点和之前的 Profiler 和 DTA 是完全不一样的。唯一的一个问题就是:每次 SQL Server 服务重启,这些保存在内存中的 DMV 信息就没有了,又是从头开始,慢慢的保存。当然,对于这个问题,我们有很多的解决方案,例如,我们可以定期的将 DMV 的信息导出,保存在磁盘上。

DMV 包含了的信息有很多:索引相关的,查询执行相关的,还有 SQL Server OS 相关的,Common Language Runtime(CLR)相关的,事务相关,安全相关的,资源管理相关的,数据备份相关的,I/O 相关,全文查找相关,数据库镜像相关的,等等信息。所以,我们完全可以使用已经保存在 DMV 中的信息来进行我们的分析。

因为 SQL Server 内部的 DMV 很多,我们本次系类的文章注重在性能分析与调优上,所以,我们主要关注以下几类 DMV:索引相关,执行相关,SQL Server OS 相关,CLR 相关,事务相关,I/O 相关,数据库相关。

下面,我们分析一个查询的运行,看看在这个过程中 SQL Server 都记录了哪些信息(或者说,DMV 中保存了什么信息):

  1. 查询的执行计划(即描述了一个查询是如何被执行的)
  2. 什么索引被使用
  3. 什么索引本来应该被用到,但是又没有使用。(因为此时存在缺失索引的性能问题)
  4. I/O 的状态(包含逻辑 I/O 操作和物理的 I/O 操作)
  5. 查询执行消耗的时间
  6. 查询等待其他资源消耗的时间
  7. 查询在等待什么资源

通过分析这些信息,不仅仅可以使得我们更好的理解查询的是如何工作的,并且还可以让我们思考如何更加合理,高效的使用资源,提高性能。

一般而言,在使用 DMV 的时候,我们很多时候也需要将其与 DMF(Dynamic Management Functions)一起使用。我们可以简单的将 DMF 理解为 SQL Server 内部的一系列函数。例如,通过分析 sys.dm_exec_query_stats,可以知道查询的相关信息,如果将 sys.dm_exec_query_stats 里面的 sql_handle 传给 sys.dm_exec_sql_text,那么,我们就可以知道查询的语句的内容。

DMV 简单示例

为了使得大家对 DMV 有更加深入的了解,我们首先来看看一个使用 DMV 来找出那些查询运行的最慢。(朋友们可能对这里提到的相关的 DMV 和 DMF 不太熟悉,没关系,后续文章会介绍)

在 SQL Server 的查询分析器中,运行一下 SQL 语句:

此时,运行的结果如下:

在这个查询中,我们主要是通过将 sys.dm_exec_query_stats 这个 DMV 与 sys.dm_exec_sql_text 和 sys.dm_exec_query_plan 这两个 DMF 结合,通过分析查询所消耗的时间,然后按照从高到低进行排序,选出前 20 个进行展示。

从这个示例中,我们可以知道几点:

  1. 查询 DMV 时,应该尽可能的将对数据库的影响降到最小。所以,我们在查询的最上面,加上了:SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED。因为每次在运行查询的时候,或多或少的会对数据库产生不同程度的锁定,并且锁定的级别各不一样。通过上面的设置,就告诉 SQL Server,接下来的执行的查询将锁定的级别定为:Read Uncommitted。从而将影响减小到最小。
  2. 每次进行性能问题诊断的时候,首先要解决最严重的性能问题。所以,我们此处只是找出前 20 个运行最慢的查询语句。
  3. 虽然原生的 DMV 信息提供了很多的信息,但是很多时候需要对 DMV 进行复杂的统计分析。(这个成本比分析 SQL Server Profiler 收集到的数据小,也更加简单,准确。)

DMV 可以解决哪些问题

看完了上面的简单的例子之后,相信朋友们对 DMV 有了一个感性的认识,下面,我们就来看看,利用 DMV,我们可以解决哪些问题。

故障诊断

诊断就是要识别出问题的所在。有很多的方式和工具可以帮助我们达到这个目的,但是,有了 DMV,可能效率会更快:没有什么比分析 SQL Server 内部的元数据来的更快。

很多时候,对问题的诊断也是性能调优的第一步,搞清楚了问题,才好对症下药。

利用 DMV 可以诊断出以下问题:最慢的查询语句,常见的等待与阻塞,没有用的索引,大量的 I/O 操作,利用率最低的执行计划。

正如之前所说,我们可以在不同的级别上面分析问题,例如从整个服务器级别,数据库级别,甚至是某个查询。我们可以通过在获取 DMV 信息时,设置获取信息的条件来办到。例如,在上一小节的示例中,就是获取整个 SQL Server 中找出最慢的前 20 个查询,如果需要,我们完全可以将条件缩小到某个数据库。

很多时候,在识别问题的时候,不是那么容易,仅仅通过一个 DMV 就搞定了的,需要和 DMF 结合。甚至要和其他的 DMV 一起结合分析(在后续文章中,我们会理解的更加深刻)。

诊断出了问题,是一个方面,解决问题也尤为重要。

性能调优

性能调优主要是利用相关的技巧技术之前诊断中出现的问题,从而提升性能。我们后续会详细讲述,这里就不再赘述了。

状态监控

很多的 DMV(特别是那些以 sys.dm_exec_ 开头的)都反映了数据库服务器执行的状态。通过查看这些 DMV,我们可以清楚的知道数据库服务器的现在的状态和历史的状态(当然,如何 SQL Server 服务被重启,那么之前的信息都丢失了,除非定期做了保存)。例如,数据库需要做批处理等长时间的操作,如果其中操作执行超时或运行的非常慢,这个时候,我们就可以查询 DMV 来分析。如果采用 Profiler 或者相关的 Profiler 脚本跟踪,会对数据库服务器的压力相当大。再如,还可以分析数据库中现在有哪些查询在运行,有多少请求在处理,打开多少连接等等,主要是对数据库的操作,都可以通过 DMV 查询到。

到这里,不知道朋友们是否有点“跃跃欲试”的冲动,我们在后续,会为朋友们一一奉上。敬请关注。

关于作者

汪洋,现任惠普架构师、信息分析师《NET 应用架构设计:模式、原则与实践》作者。上海益思研发管理咨询有限公司首席软件架构专家,软件咨询组副组长。


感谢崔康对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家加入到 InfoQ 中文站用户讨论组中与我们的编辑和其他读者朋友交流。

2011-12-21 00:006776

评论

发布
暂无评论
发现更多内容

架构训练营毕业设计-电商秒杀系统

李焕之

架构实战营-毕业总结

李焕之

讨论:低代码集成OA/ERP/MES系统,或将是企业应用生态的重要一环?

优秀

低代码

TDSQL在核心交易系统领域的联合解决方案

腾讯云数据库

tdsql 国产数据库

使用Git将本地项目添加至Git仓库

Bug终结者

Java 实用工具 gitee git version

Linux之pwd命令

入门小站

Linux

大数据开发之Spark和Flink的对比(转载)

@零度

大数据 flink spark

我还是很怀念谷歌

张老蔫

28天写作

十年所学,终成《代码随想录》!

博文视点Broadview

TDSQL | ‘‘微盟式’’SaaS,让商业变得更智慧

腾讯云数据库

tdsql 国产数据库

区块链电子合同应用平台开发,区块链电子合同解决方案

电微13828808271

如何使用会声会影标题工具制作弹幕效果

懒得勤快

使用HTML,CSS和Javascript构建响应式导航栏和面包屑菜单

海拥(haiyong.site)

响应式 大前端 28天写作 签约计划第二季 12月日更

TDSQL | 云原生时代的数据库技术革命

腾讯云数据库

tdsql 国产数据库

京东白条数据架构进化之路:要在数据的不确定性中探索架构的稳定性

SphereEx

数据库 开源 架构 ShardingSphere 京东白条

前端开发MySQL 数据库之数据引擎

@零度

MySQL 前端

详细解读MySQL高性能优化

秋水

MySQL性能优化 内容合集 签约计划第二季

TDengine入驻Rainbond开源应用商店

北京好雨科技有限公司

时序数据库 #Kubernetes# rainbond

How to construct a Playground Project

Changing Lin

12月日更

智慧园区综合管理平台解决方案,智慧平安社区搭建

电微13828808271

【SpringCloud技术专题】「Gateway网关系列」(2)微服务网关服务的Gateway功能配置指南分析

洛神灬殇

api 网关 SpringCloud Gateway netty 12月日更 服务网关

架构实战营模块六作业

渐行渐远

架构实战营

运营商行业软件开发| 内容合集

鲸品堂

通信 运营商 技术专题合集

Linux之mkdir命令

入门小站

Linux

在线JSON转GraphQL工具

入门小站

工具

云原生应用管理,像管理手机APP一样管理企业应用

北京好雨科技有限公司

PaaS #Kubernetes# 应用管理

Dubbo 框架学习笔记二

风翱

dubbo 12月日更

MySQL性能优化:EXPLAIN 执行计划与join

秋水

MySQL性能优化 执行计划 内容合集 签约计划第二季

如何利用测试自动化,实现 DevOps?

SoFlu软件机器人

Android C++系列:Linux Socket编程(一)预备知识

轻口味

android 28天写作 12月日更

基于SSM+Shiro+Bootstrap实现用户权限管理系统

Bug终结者

Java bootstrap ssm shiro

SQL Server大负载的生产环境下的性能优化:初识元数据优化_后端_Geek_45cf6f_InfoQ精选文章