Sql Server中的非聚集索引详细介

  非聚集索引,这个是大家都非常熟悉的一个东西,有时候我们由于业务原因,sql写的非常复杂,需要join很多张表,然后就泪流满面了。。。这时候就有DBA或者资深的开发给你看这个猥琐的sql,通过执行计划一分析。。。或许就看出了不该有的表扫描。。。万恶之源。。。然后给你在关键的字段加上非聚集索引后。。。才发现提速比阿斯顿马丁还要快。。。那么一个问题来了,为什么非聚集索引能提速这么快。。。怎么做到的???是不是非常的好奇???

这篇我们来解开神秘面纱。

 一:现象

先让我们一睹非聚集索引的真容,看看到底在执行计划看来是个什么玩意。。。我这里有个product表,里面灌了8w多数据,然后在Name列上建立

一个非聚集索引,就像下图一样:

  

从上图中看到了两个好玩的东西,一个就是我想看到的“索引查找[nonclustered]”,这个大家很熟悉,也是这篇要说的,然后我们还看到了一个“RID查找”,乍一看这是什么鸡巴玩意。。。非聚集索引跟它扯上什么关系了???

二:什么是RID

  通过前面几篇,我想大家都知道了数据页中的记录是如何寻找的?秘密就是通过slot槽位中的偏移量决定的,那问题来了,如果上升到数据页层面,我只需要(pageID:slotID)就可以找到记录了,对不对?那如果我上升了文件层面,那是不是只需要知道(fileID:pageID:slotID)就可以找到数据页中的 记录了?其实这里的RID就是站在文件的高度通过(fileID:pageID:slotID)找到表记录的。。。既RID=RowID=(fileID:pageID:slotID),如果你非要眼见实的话,在sq中l还真提供了这么个函数(sys.fn_PhysLocFormatter(%%physloc%%)),我们看下图:

看了上面的图,是不是很兴奋,一目了然,比如productID=18088这条记录,然来是在1号文件,34941号数据页,0号槽位上,productID=18089是在1号槽位上,好了,当你知道RID是个什么东西的时候,我想你已经离彻底理解非聚集索引不远啦。。。

 三:非聚集索引

  有一点我们肯定知道,就是非聚集索引是可以加速查找的,要是跟表扫描那样的龟速,那也就失去了索引的目的,既然能加速,是因为它和聚集索引一样,在底层都玩起了B树,首先我们插入一些样例数据。

DROP TABLE dbo.Person

CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900))
CREATE INDEX idx_Person_Name ON dbo.Person(Name)

DECLARE @ch AS INT=97

WHILE @ch<=122
BEGIN
  INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5))
  SET @ch=@ch+1
END

上面的sql,我故意在Name列设置为900个char,这也是索引的上限值,这样的话,我DBCC就可以导出很多数据页和索引页了。

可以看到,当我dbcc ind 的时候,发现Person表中已经有4个数据页,5个索引页,其中151号数据页是表跟踪页,174号为索引跟踪页,这也就说明当我建立索引后,引擎给我们分配了专门的索引页来存放我们建立的Name索引,那下一步就是我们来看看这些索引中都存放着什么,这也是我非常关心的,接下来我导出173号索引页。

代码如下:

DBCC PAGE(Ctrip,1,173,1)

Slot 0, Offset 0x60, Length 912, DumpStyle BYTE

Record Type = INDEX_RECORD      Record Attributes = NULL_BITMAP   Record Size = 912

Memory Dump @0x000000000EF1C060

0000000000000000:  16616161 61612020 20202020 20202020 †.aaaaa
0000000000000010:  20202020 20202020 20202020 20202020 †
0000000000000020:  20202020 20202020 20202020 20202020 †
0000000000000030:  20202020 20202020 20202020 20202020 †
0000000000000040:  20202020 20202020 20202020 20202020 †
0000000000000050:  20202020 20202020 20202020 20202020 †
0000000000000060:  20202020 20202020 20202020 20202020 †
0000000000000070:  20202020 20202020 20202020 20202020 †
0000000000000080:  20202020 20202020 20202020 20202020 †
0000000000000090:  20202020 20202020 20202020 20202020 †
00000000000000A0:  20202020 20202020 20202020 20202020 †
00000000000000B0:  20202020 20202020 20202020 20202020 †
00000000000000C0:  20202020 20202020 20202020 20202020 †
00000000000000D0:  20202020 20202020 20202020 20202020 †
00000000000000E0:  20202020 20202020 20202020 20202020 †
00000000000000F0:  20202020 20202020 20202020 20202020 †
0000000000000100:  20202020 20202020 20202020 20202020 †
0000000000000110:  20202020 20202020 20202020 20202020 †
0000000000000120:  20202020 20202020 20202020 20202020 †
0000000000000130:  20202020 20202020 20202020 20202020 †
0000000000000140:  20202020 20202020 20202020 20202020 †
0000000000000150:  20202020 20202020 20202020 20202020 †
0000000000000160:  20202020 20202020 20202020 20202020 †
0000000000000170:  20202020 20202020 20202020 20202020 †
0000000000000180:  20202020 20202020 20202020 20202020 †
0000000000000190:  20202020 20202020 20202020 20202020 †
00000000000001A0:  20202020 20202020 20202020 20202020 †
00000000000001B0:  20202020 20202020 20202020 20202020 †
00000000000001C0:  20202020 20202020 20202020 20202020 †
00000000000001D0:  20202020 20202020 20202020 20202020 †
00000000000001E0:  20202020 20202020 20202020 20202020 †
00000000000001F0:  20202020 20202020 20202020 20202020 †
0000000000000200:  20202020 20202020 20202020 20202020 †
0000000000000210:  20202020 20202020 20202020 20202020 †
0000000000000220:  20202020 20202020 20202020 20202020 †
0000000000000230:  20202020 20202020 20202020 20202020 †
0000000000000240:  20202020 20202020 20202020 20202020 †
0000000000000250:  20202020 20202020 20202020 20202020 †
0000000000000260:  20202020 20202020 20202020 20202020 †
0000000000000270:  20202020 20202020 20202020 20202020 †
0000000000000280:  20202020 20202020 20202020 20202020 †
0000000000000290:  20202020 20202020 20202020 20202020 †
00000000000002A0:  20202020 20202020 20202020 20202020 †
00000000000002B0:  20202020 20202020 20202020 20202020 †
00000000000002C0:  20202020 20202020 20202020 20202020 †
00000000000002D0:  20202020 20202020 20202020 20202020 †
00000000000002E0:  20202020 20202020 20202020 20202020 †
00000000000002F0:  20202020 20202020 20202020 20202020 †
0000000000000300:  20202020 20202020 20202020 20202020 †
0000000000000310:  20202020 20202020 20202020 20202020 †
0000000000000320:  20202020 20202020 20202020 20202020 †
0000000000000330:  20202020 20202020 20202020 20202020 †
0000000000000340:  20202020 20202020 20202020 20202020 †
0000000000000350:  20202020 20202020 20202020 20202020 †
0000000000000360:  20202020 20202020 20202020 20202020 †
0000000000000370:  20202020 20202020 20202020 20202020 †
0000000000000380:  20202020 20940000 00010000 00020000 †   ...........

代码如下:

Row - Offset                        
7 (0x7) - 6480 (0x1950)             
6 (0x6) - 5568 (0x15c0)             
5 (0x5) - 4656 (0x1230)             
4 (0x4) - 3744 (0xea0)              
3 (0x3) - 2832 (0xb10)              
2 (0x2) - 1920 (0x780)              
1 (0x1) - 1008 (0x3f0)              
0 (0x0) - 96 (0x60)

从上面至少可以发现三个有趣的现象:

<1>:173号索引页中slot0和slot1槽位指向记录的内容已经有序了,比如:aaaaa,bbbbb。。。。这样。。。。原来非聚集索引也是有序呀。。。

<2>:6161616161就是16进制的aaaaa。

    9400000001000000 :这几个数字非常重要,因为是16进制表示,所以2位16进制表示一个字节,所以可以这么解释,前面4个字节表示

    pageID,中间2个字节表示fileID,后面2个字节表示slot,看到这里你是不是想起了RID。。。因为RID就是这三样的组合。。。原来非聚集索

   引的记录存放的就是“key+RowID”呀。。。。

<3>:通过最后的槽位列表,可以得知173号索引页上存放着8条索引记录。

  好了,看完了叶子节点,我们再看分支节点,也就是IndexLevel=1的那条索引数据页,也就是78号。ok,dbcc看看吧。

当看到这个列表的时候,不知道你脑子里面是不是有一幅图出来了,就像上一篇看到聚集索引一样,因为它的结构和聚集索引非常像,只不过非聚集索引这里多了一个RID而已。。。最后我也把图贡献一下。

总结一下:在走非聚集索引的时候,比如你的条件是where name='jjjjj' 时,它的逻辑是这样的,根据78号索引数据页的key的范围,然后通过rowid走到了79号索引数据页,然后在79号索引数据页中顺利的找到了jjjjj,这时候就可以拿出jjjjj的rowid去表数据页中直接定位记录,最后输出。。。。。这个也就是博客开头的地方为什么会出现RID的查找。。。

(0)

相关推荐

  • SQL2005重新生成索引的的存储过程 sp_rebuild_index 原创

    公司运营着的网站,流量很大,网站是交互式的,经常在过了三四个月的时候索引生成的碎片就很多,由于很大一部分页面没有生成静态,这就导致网站在打开的速度上会变慢. 以前都是手工右击索引重新生成,但是索引太多,操作起来费时费力,索引在网上找了个存储过程,自己整理了一下,执行的时候只需要选择相应的数据库,运行exec sp_rebuild_index即可,如下. USE [master] GO SET ANSI_NULLS ON GO SET QUOTED_IDENTIFIER ON GO CREATE

  • 详解sqlserver查询表索引

    SELECT   索引名称=a.name ,表名=c.name ,索引字段名=d.name ,索引字段位置=d.colid FROM sysindexes a JOIN sysindexkeys b ON a.id=b.id AND a.indid=b.indid JOIN sysobjects c ON b.id=c.id JOIN syscolumns d ON b.id=d.id AND b.colid=d.colid WHERE a.indid NOT IN(0,255) -- and

  • 在SQL SERVER中导致索引查找变成索引扫描的问题分析

    SQL Server 中什么情况会导致其执行计划从索引查找(Index Seek)变成索引扫描(Index Scan)呢? 下面从几个方面结合上下文具体场景做了下测试.总结.归纳. 1:隐式转换会导致执行计划从索引查找(Index Seek)变为索引扫描(Index Scan) Implicit Conversion will cause index scan instead of index seek. While implicit conversions occur in SQL Serve

  • SQL2005CLR函数扩展 - 关于山寨索引

    本文只是一个山寨试验品,思路仅供参考. --------------------------------------------------------------------------------原理介绍:索引建立 目录结构划分方案也只是很简易的实现了一下,通过unicode把任意连续的两个字符(中文或英文)分为4个字节来做四层目录,把索引的内容对应的主关键字(主要为了使用sql索引和唯一性)作为文件名,两个字符在索引内容中的位置作为文件后缀来存储.文件本身为0字节,不保存任何信息. 比如一

  • SQL2000 全文索引完全图解

    全文检索可以对varchar,text,image型字段进行检索,但一个表最多只能建一个全文索引SQL Server 2000 引入了对存储在 image 列中的这些类型的数据执行全文检索的能力.如果没有全文索引,对字符的模糊查询只能对基表进行全表扫描(或索引扫描),执行模糊查询都需要对全表扫描或索引扫描意味着消耗大量IO.如果模糊查询经常发生,会造成数据库性能恶化.本篇为简单起见,仅在varchar型字段上图文演示非常完整的而且是高效可行的全文索引创建及维护过程.1:在企业管理器中展开要建立全

  • mssql 建立索引第1/2页

    表的索引与附在一本书后面的索引非常相似.它可以极大地提高查询的速度.对一个较大的表来说,通过加索引,一个通常要花费几个小时来完成的查询只要几分钟就可以完成.因此没有理由对需要频繁查询的表增加索引. 注意: 当你的内存容量或硬盘空间不足时,也许你不想给一个表增加索引.对于包含索引的数据库,SQL Sever需要一个可观的额外空间.例如,要建立一个聚簇索引,需要大约1.2倍于数据大小的空间.要看一看一个表的索引在数据库中所占的空间大小,你可以使用系统存储过程sp_spaceused,对象名指定为被索

  • MSSQL自动重建出现碎片的索引的方法分享

    1.索引碎片的产生? 由于在表里大量的插入.修改.删除操作而使索引页分裂.如果索引有了高的碎片,有两种情况,一种情况是扫描索引需要花费很多的时间,另一种情况是在查询的时候索引根本不使用索引,都会导致性能降低. 2.碎片类型分为: 2.1 内部破碎 由于索引页里的数据插入或修改操作而发生,以数据作为稀疏矩阵的形式的分布而结束,这将导致数据页的增加,从而增加查询时间. 2.2外部破碎 由于索引/数据页的数据插入或修改而发生,以页码分离和在文件系统里不连贯的新的索引页的分配而结束,数据库服务器不能利用

  • 理解Sql Server中的聚集索引

    说到聚集索引,我想每个码农都明白,但是也有很多像我这样的猥程序员,只能用死记硬背来解决这个问题,什么表中只能建一个聚集索引,然后又扯到了目录查找来帮助读者记忆....问题就在这里,我们不是学文科,,,不需要去死记硬背,,,我们需要的就是能看到在眼里面的真实东西.....我们都喜欢聚集索引,因为它能够把无序的堆表记录变成有序,还玩起了B树...这样就把复杂度从N降低到了LogMN... 这样的话逻辑读,物理读就下来了.  一:现象 1:无索引的情况 还是老规矩,看个例子感受下,首先我有一个Prod

  • MSSQL 大量数据时,建立索引或添加字段后保存更改提示超时的解决方法

    一般我们都喜欢用数据库管理器的UI来对数据表结构进行更改,然后自然而然地点"保存" 按钮进行保存,但数据量比较大的时候,用这招往往会出现"无法创建索引"IX_索引名". 超时时间已到.在操作完成之前超时时间已过或服务器未响应. "这种错误.一时不知所措,蜡人张的文章 复制代码 代码如下: 修改表属性后使用"索引/键"对话框为一个大型表(记录数13,239,473)创建索引,提示: - 无法创建索引"IX_TableN

  • 关于重新组织和重新生成索引sp_RefreshIndex的介绍

    开始: -------------------------------------------------------------------------------- 在上周,客户反映一个系统问题,当处理大量数据的时候,出现网络超时.后来,我们跟踪测试,发现是由于索引碎片多而引起的网络超时. 解决方法,自然是重新组织和重新生成索引.在这里,我写了一个存储过程sp_RefreshIndex来实现. 存储过程sp_RefreshIndex: 复制代码 代码如下: use mastergoif ob

随机推荐