如何调优SQL Server查询

2025-03-29 03:15:55

在今天的文章里，我想给你展示下，当你想对特定查询创建索引设计时，如何把你的工作和思考过程传达给查询优化器。下面就一起来探讨一下吧！

有问题的查询
我们来看下列查询：

 DECLARE @i INT = 999
 SELECT
   SalesOrderID,
   SalesOrderDetailID,
   CarrierTrackingNumber,
   OrderQty,
   LineTotal
 FROM Sales.SalesOrderDetail
 WHERE ProductID < @i
 ORDER BY CarrierTrackingNumber
 GO

如你所见，这里用了一个本地变量与一个不等于谓语来从Sales.SalesOrderDetail表来获取一些记录。当你执行那个查询，看它的执行计划时，你会发现它有一些严重的问题：

SQL Server需要扫描Sales.SalesOrderDetail表的整个非聚集索引，因为没有支持的非聚集索引。对这个扫描，查询需要1382个逻辑读，运行时间近800毫秒。
查询优化器在查询计划里引入了筛选器（Filter）运算符，它进行逐行比较用来检查符合的行（ProductID < @i）
因为ORDER BY CarrierTrackingNumber，在执行计划里一个排序（Sort）运算符被引入。
排序运算符蔓延到了TempDb，因为不正确的基数计算（Cardinality Estimation）。用了带了本地变量与不等于谓语的组合，SQL Server从表的基数硬码估计30%的行。在我们的情况里估计行数是36395（121317 * 30%）。实际上查询返回120621行，这意味这排序（Sort）运算符必须蔓延到TempDb，因为请求的内存授予太小了。

现在我问你——你能改善这个查询么？你的建议是什么？休息下，想个几分钟。不修改查询本身，你如何改善这个查询？

我们来调试查询！
当然，我们要做索引相关的调整来改善。没有支持的非聚集索引，那只能是查询优化器唯一可以使用计划来运行我们的查询。但对这个指定查询，什么是好的非聚集索引呢？一般来说，我通过看搜索谓语来考虑可能的非聚集速印。在我们的例子里，搜索谓语如下：

WHERE ProductID < @i

我们请求在ProductID列过滤的行。因此我们想在那个列创建支持的非聚集索引。我们建立索引：

CREATE NONCLUSTERED INDEX idx_Test ON Sales.SalesOrderDetail(ProductID)

 GO

在非聚集索引创建后，我们需要验证下改变，因此我们再次执行刚才的查询代码。结果如何捏？查询优化器并没有使用我们刚创建的非聚集索引！我们在搜索谓语上创建了支持的非聚集索引，查询优化器没有引用它？通常人们对此就无辙了。其实我们可以提示查询优化器来使用非聚集索引，来更好的理解“为什么”查询优化器没有自动选择索引：

 DECLARE @i INT = 999

 SELECT
  SalesOrderID,
  SalesOrderDetailID,
  CarrierTrackingNumber,
  OrderQty,
  LineTotal
FROM Sales.SalesOrderDetail WITH (INDEX(idx_Test))
WHERE ProductID < @i
 ORDER BY CarrierTrackingNumber
 GO

当你现在看执行计划时，你会看到下列的野性——一个并行计划：

查询花费了370109个逻辑读！运行时间基本和刚才的一样。这里到底发生了什么？当你仔细看执行计划，你会发现查询优化器引入了书签查找，因为刚才创建的非聚集索引，对于查询来说，不是一个覆盖非聚集索引。查询越过了所谓的临界点（Tipping Point），因为我们用当前的搜索谓语来获得几乎所有行。因此用非聚集索引和书签查找来组合没有意义。

不去想为什么查询优化器不选择刚才创建的非聚集索引，我们已经把自己的思路表达给了查询优化器本身，通过查询提示进行了询问了查询优化器，为什么非聚集索引没被自动选择。如我刚开始说的：我不想考虑太多。

使用非聚集索引解决这个问题，在非聚集索引的叶子层，我们必须对从SELECT列表的请求的额外列进行包含。你可以再次看下书签查找来看下在叶子层哪些列当前丢失：

CarrierTrackingNumber
OrderQty
UnitPrice
UnitDiscountPrice

我们重建那个非聚集索引：

CREATE NONCLUSTERED INDEX idx_Test ON Sales.SalesOrderDetail(ProductID)
INCLUDE (CarrierTrackingNumber, OrderQty, UnitPrice, UnitPriceDiscount)
 WITH
(
 DROP_EXISTING = ON
 )
GO

我们已经做出了另1个改变，因此我们可以重新运行了查询来验证下。但是这次我们不加查询提示，因为现在查询优化器会自动选择非聚集索引。结果如何捏？当你看执行计划时，索引现在已被选择。

SQL Server现在在非聚集索引上进行了查找操作，但在执行计划里我们还有排序（Sort）运算符。因为基数计算30%的硬编码，排序（Sort）还是要蔓延到TempDb。偶滴神！我们的逻辑读已经降到了757，但运行时间还是近800毫秒。你现在应该怎么做？

现在我们可以尝试在非聚集索引的导航结构直接包含CarrierTrackingNumber列。这是SQL Server进行排序运算符的列。当我们在非聚集索引直接加了这列（作为主键），我们就物理排序了那列，因此排序（Sort）运算符应该会消失。作为积极的副作用，也不会蔓延到TempDb。在执行计划里，现在也没有运算符关心错误的基数计算。因此我们尝试那个假设，再次重建非聚集索引：

 CREATE NONCLUSTERED INDEX idx_Test ON Sales.SalesOrderDetail(CarrierTrackingNumber, ProductID)
INCLUDE (OrderQty, UnitPrice, UnitPriceDiscount)
 WITH
(
   DROP_EXISTING = ON
 )
GO

从索引定义可以看到，现在我们已经对CarrierTrackingNumber和ProductID列的数据物理预排序。当你再次重新执行查询，在你查看执行计划时，你会看到排序（Sort）运算符已经消失，SQL Server扫描了非聚集索引的整个叶子层（使用剩余谓语（residual predicate）作为搜索谓语）。

这个执行计划并不坏！我们只需要763个逻辑读，现在的运行时间已经降至600毫秒。和刚才的相比已经有25%的改善！但是：查询优化器建议我们一个更好的非聚集索引，通过缺少索引建议（Missing Index Recommendations）！暂且相信下，我们创建建议的非聚集索引：

CREATE NONCLUSTERED INDEX [SQL Server doesn't care about names, why I should care about names?]
ON [Sales].[SalesOrderDetail] ([ProductID])
INCLUDE ([SalesOrderID],[SalesOrderDetailID],[CarrierTrackingNumber],[OrderQty],[LineTotal])
GO

当你现在重新执行最初的查询，你会发现令人惊讶的事情：查询优化器使用“我们”刚才创建的非聚集索引，缺少索引建议已经消失！

你刚刚创建了SQL Server从不使用的索引——除了INSERT，UPDATE和DELETE语句，SQL Server都要去维护你的非聚集索引。对于你的数据库，你刚创建了“单纯”浪费空间的索引。当另一方面，你已经通过消除丢失索引建议，满足了查询优化器。但这不是目的：目的是创建会被再次使用的索引。

结论：永不相信查询优化器！

小结

今天的文章有点争议性，但我想你向你展示下，但你在创建索引时，查询优化器如何帮助你，还有查询优化器如何愚弄你。因此做出小的调整，就立即运行你的查询，验证改变非常重要。

以上就是本文的全部内容，希望对大家的学习有所帮助。

sqlserver性能调优经验总结

相信不少的朋友,无论是做开发.架构的,还是DBA等,都经常听说"调优"这个词.说起"调优",可能会让很多技术人员心头激情澎湃,也可能会让很多人感觉苦恼.当然,也有很多人对此不屑一顾,因为并不是每个人接触到的项目都很大,也不是每个人做的项目都对性能要求很高. 在主流的企业级开发和互联网应用中,数据库的重要性是不言而喻的,而数据库的性能对于整个系统的性能而言也是至关重要的,这里无庸赘述. sqlserver的性能调优,其实是个很宽广的话题.坦白讲,想从概念到实践的完全讲
一次SQL调优数据库性能问题后的过程(300W)

将绝大部分的SQL查询改为存储过程,这样的操作毫无疑问可以提高部分性能. 凡是使用"select * from xxx"的操作一律具体到所需字段. 使用join连接2个以上大量数据的表,且基础数据表变化不大的查询一律使用视图,并为此视图建立索引.理由来自SQL Server联机帮助手册: "对于标准视图而言,为每个引用视图的查询动态生成结果集的开销很大,特别是对于那些涉及对大量行进行复杂处理(如聚合大量数据或联接许多行)的视图.如果在查询中频繁地引用这类视图,可通过对视图创建
Mysql优化调优中两个重要参数table_cache和key_buffer

本文根据作者的一点经验,讨论了Mysql服务器优化中两个非常重要的参数,分别是table_cache,key_buffer_size. table_cache指示表高速缓存的大小.当Mysql访问一个表时,如果在Mysql表缓冲区中还有空间,那么这个表就被打开并放入表缓冲区,这样做的好处是可以更快速地访问表中的内容.一般来说,可以通过查看数据库运行峰值时间的状态值Open_tables和Opened_tables,用以判断是否需要增加table_cache的值,即如果open_tables接近t
Sql server2005 优化查询速度50个方法小结

I/O吞吐量小,形成了瓶颈效应. 没有创建计算列导致查询不优化. 内存不足. 网络速度慢. 查询出的数据量过大(可以采用多次查询,其他的方法降低数据量). 锁或者死锁(这也是查询慢最常见的问题,是程序设计的缺陷). sp_lock,sp_who,活动的用户查看,原因是读写竞争资源. 返回了不必要的行和列. 查询语句不好,没有优化. 可以通过如下方法来优化查询 : 1.把数据.日志.索引放到不同的I/O设备上,增加读取速度,以前可以将Tempdb应放在RAID0上,SQL2000不在支持.数据量(
mysql 性能的检查和调优方法

在遇到严重性能问题时,一般都有这么几种可能:1.索引没有建好; 2.sql写法过于复杂; 3.配置错误; 4.机器实在负荷不了; 1.索引没有建好如果看到mysql消耗的cpu很大,可以用mysql的client工具来检查. 在linux下执行 /usr/local/mysql/bin/mysql -hlocalhost -uroot -p 输入密码,如果没有密码,则不用-p参数就可以进到客户端界面中. 看看当前的运行情况 show full processlist 可以多运行几次这个命令可
SqlServer 执行计划及Sql查询优化初探

网上的SQL优化的文章实在是很多,说实在的,我也曾经到处找这样的文章,什么不要使用IN了,什么OR了,什么AND了,很多很多,还有很多人拿出仅几S甚至几MS的时间差的例子来证明着什么(有点可笑),让许多人不知道其是对还是错.而SQL优化又是每个要与数据库打交道的程序员的必修课,所以写了此文,与朋友们共勉. 谈到优化就必然要涉及索引,就像要讲锁必然要说事务一样,所以你需要了解一下索引,仅仅是索引,就能讲半天了,所以索引我就不说了(打很多字是很累的,况且我也知之甚少),可以去参考相关的文章,这个网上
MySQL慢查询查找和调优测试

编辑 my.cnf或者my.ini文件,去除下面这几行代码的注释: 复制代码代码如下: log_slow_queries = /var/log/mysql/mysql-slow.log long_query_time = 2 log-queries-not-using-indexes 这将使得慢查询和没有使用索引的查询被记录下来. 这样做之后,对mysql-slow.log文件执行tail -f命令,将能看到其中记录的慢查询和未使用索引的查询. 随便提取一个慢查询,执行explain: 复制代
10个MySQL性能调优的方法

MYSQL 应该是最流行了 WEB 后端数据库.WEB 开发语言最近发展很快,PHP, Ruby, Python, Java 各有特点,虽然 NOSQL 最近越來越多的被提到,但是相信大部分架构师还是会选择 MYSQL 来做数据存储. MYSQL 如此方便和稳定,以至于我们在开发 WEB 程序的时候很少想到它.即使想到优化也是程序级别的,比如,不要写过于消耗资源的 SQL 语句.但是除此之外,在整个系统上仍然有很多可以优化的地方. 1. 选择合适的存储引擎: InnoDB 除非你的数据表使用来做
如何调优SQL Server查询

在今天的文章里,我想给你展示下,当你想对特定查询创建索引设计时,如何把你的工作和思考过程传达给查询优化器.下面就一起来探讨一下吧! 有问题的查询我们来看下列查询: DECLARE @i INT = 999 SELECT SalesOrderID, SalesOrderDetailID, CarrierTrackingNumber, OrderQty, LineTotal FROM Sales.SalesOrderDetail WHERE ProductID < @i ORDER BY Carr
Sql Server 查询性能优化之走出索引的误区分析

据了解绝大多数开发人员对于索引的理解都是一知半解,局限于大多数日常工作没有机会.也什么没有必要去关心.了解索引,实在哪天某个查询太慢了找到查询条件建个索引就ok,哪天又有个查询慢了,再建立个索引就是,或者干脆把整个查询SQL直接发给DBA,让DBA直接帮忙优化了,所以造成的状况就是开发人员对于索引的理解.认识很局限,以下就把我个人对于索引的理解及浅薄认识和大家分享下,希望能解除一些大家的疑惑,一起走出索引的误区误区1.在表上建立了索引,在查询时用到了索引的列,索引就一定会生效首先明确下这样的
教你如何看懂SQL Server查询计划

对于SQL Server的优化来说,优化查询可能是很常见的事情.由于数据库的优化,本身也是一个涉及面比较的广的话题,因此本文只谈优化查询时如何看懂SQL Server查询计划.毕竟我对SQL Server的认识有限,如有错误,也恳请您在发现后及时批评指正. 首先,打开[SQL Server Management Studio],输入一个查询语句看看SQL Server是如何显示查询计划的吧. 说明:本文所演示的数据库,是我为一个演示程序专用准备的数据库,可以在此网页中下载. select v.O
SQL Server查询前N条记录的常用方法小结

本文实例讲述了SQL Server查询前N条记录的常用方法.分享给大家供大家参考.具体如下: SQL Server查询前N条记录是我们经常要用到的操作,下面对SQL Server查询前N条记录的方法作了详细的介绍,如果您感兴趣的话,不妨一看. SQL Server查询前N条记录: 因为id可能不是连续的,所以不能用取得10<id<20的记录的方法. 有三种方法可以实现: 一.搜索前20条记录,指定不包括前10条语句: 复制代码代码如下: select top 20 * from tbl w
SQL Server查询条件IN中能否使用变量的示例详解

在SQL Server的查询条件中,能否在IN里面使用变量呢? 如果可以的话,有没有需要注意的地方或一些限制呢?在回答这个问题前,我们先来看看这个例子: IF EXISTS (SELECT 1 FROM sys.objects WHERE name='TEST' AND type='U') BEGIN DROP TABLE TEST; END GO CREATE TABLE TEST ( ID INT, NAME VARCHAR(16) ); GO INSERT INTO dbo.TEST SE
SQL Server查询某个字段在哪些表中存在

一.查询SQL Server中所有的表 SQL语句: SELECT * FROM sys.tables name列表示所有的表名. 二.查询SQL Server中所有的列 SQL语句: SELECT * FROM sys.columns name列表示所有的字段名称. 两张表根据object_id进行关联语法: select * from sys.tables tinner join sys.columns c on t.object_id=c.object and c.name='要查询的字
sql server查询语句阻塞优化性能

在生产环境下,有时公司客服反映网页半天打不到,除了在浏览器按F12的Network响应来排查,确定web服务器无故障后.就需要检查数据库是否有出现阻塞当时数据库的生产环境中主表数据量超过2000w,子表数据量超过1亿,且更新和新增频繁.再加上做了同步镜像,很消耗资源. 这时就要新建一个会话,大概需要了解以下几点: 1.当前活动会话量有多少? 2.会话运行时间? 3.会话之间有没有阻塞? 4.阻塞时间 ? 查询阻塞的方法有很多.有sql 2000 的sp_lock, 有sql 2005及以上的d
SQL Server查询结果导出到EXCEL表格的图文教程

需求: 将查询的两列数据导出到excel中 1.选择数据库,右键任务→导出数据,打开导入导出向导,单击下一步 2.在打开的SQL Server导入和导出的向导中,选择服务器名称.代表本机,身份验证使用SQL Server身份验证,输入用户名,密码,选择数据库,单击下一步 3.选择目标为Mircosoft Excel,选择Excel需要保存的路径,单击下一步 4.选择编写查询以指定要传输的数据,单击下一步 5.复制SQL语句到对话框中,单击下一步 6.可以编辑映射,查看预览,剩余的一直下一步,直至
Sql Server查询性能优化之不可小觑的书签查找介绍

小小程序猿SQL Server认知的成长 1.没毕业或工作没多久,只知道有数据库.SQL这么个东东,浑然分不清SQL和Sql Server Oracle.MySql的关系,通常认为SQL就是SQL Server 2.工作好几年了,也写过不少SQL,却浑然不知道索引为何物,只知道数据库有索引这么个东西,分不清聚集索引和非聚集索引,只知道查询慢了建个索引查询就快了,到头来索引也建了不少,查询也确实快了,偶然问之:汝建之索引为何类型?答曰:... 3.终于受到刺激开始奋发图强,买书,gg查资料终于知道
SQL Server 查询处理中的各个阶段(SQL执行顺序)示例

在大数编程语言中,代码按编码顺序被处理,但是在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但是几乎总是最后被处理. 每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入.这些虚拟表对调用者(客户端应用程序或者外部查询)不可用.只是最后一步生成的表才会返回给调用者.如果没有在查询中指定某一子句,将跳过相应的步骤.下面是对应用于SQL server 2000和SQL Server 2005的各个逻辑步骤的简单描述. 复制代码代码如下: (8)SELECT

如何调优SQL Server查询

相关推荐

随机推荐