SQL Server数据库中伪列及伪列的含义详解

2025-02-18 10:49:51

SQL Server中的伪列

下午看QQ群有人在讨论（非聚集）索引的存储，说，对于聚集索引表，非聚集索引存储的是索引键值+聚集索引键值；对于非聚集索引表，索引存储的是索引键值+RowId，这应该是一个常识，对此不作具体详细阐述。

这里主要是提到的RowId引起了一点思考。

那么，这个RowId是个什么玩意？能不能更加直观一点来看看RowId的信息？代表什么含义？这个当然也是可以的。

Oracle中的表中有一个伪列的概念，就是在查询表的时候加上select rowid，* from Table，会查询出来伪列。

SQL Server中同样有这么一个伪列，在SQL Server中，这个伪列可以认为是数据行的物理地址，下面简单来观察一下这个RowId以及RowId的含义。

伪列的测试

建一张简单的表，下面借助这个表来查看说明伪列

CREATE TABLE Test
(
 id int identity(1,1),
 name varchar(50)
)
GO

INSERT INTO Test VALUES (NEWID())
GO 100

SQL Server中有一个未公开的伪列“%%physloc%%”，也就是在查询的时候，对于任何一张表，可以加上这个字段，比如如下，就可以查到表中每一行的伪列。

这个伪列的类型是binary(8) ，也就是有8个字节，参考上图的DATALENGTH(%%physloc%%) as Len，%%physloc%%返回的记录的物理地址，其中前四个字节表示页号，中间两个字节表示文件号，最后两个字节表示槽号
为了更加方便地观察伪列的含义，sqlserver提供了一个未公开的系统函数sys.fn_PhysLocFormatter，下面借助sys.fn_PhysLocFormatter这个函数来继续观察这个伪列

如下图，这里就可以清晰地看到伪列中的信息了。

比如第一行中的(1:73:0)，上面说了，其中前四个字节表示页号，中间两个字节表示文件号，最后两个字节表示槽号，(1:73:0)这种格式是经过sys.fn_PhysLocFormatter格式化显式之后的结果。

把文件号1放在最前面，中间的73是页号（page number），最后一位0是槽号（sloc number）。

下面粗略地说一下这几个字段的含义。这里要求对SQL Server的存储只是有一个基本的认识，否则看的云里雾里。

1，首先说什么是文件号

如截图，文件号就是数据库的数据文件编号，这里只有一个数据文件，文件编号为1，建表的时候默认（这里也只能建立）建立在fileid = 1 的文件上面，fileid=2的是日志文件，就不多说了。

2，其次是页号，页号就是分配给当前这张表的数据页面（8kb的最小分配单元）的页号，我们看一下Test这个表的页面情况

借助DBCC IND命令，查询分配给这个表的页面信息，其中77号页面是IMA也面，至于什么事IMA页面，不多解释。

73号页面才是真正存储数据的页，与上面的1:73:0中的73一样，没毛病。

3，最后看一下槽号，槽号的概念要对SQL Server的数据页面有一个基本的认识，这里盗用一张网友的图。

所谓的槽号就是在数据页面中，每个页面存储多行数据，槽号用来标记每一行数据的偏移量，用大白话说就是“存储每一行数据的地址空间开始的位置”，因为每一行数据的总长度是不一样的（存在可变长度列的情况下），每一行的占用的存储空间也是不一样的，槽号或者行偏移量就是说明每一行数据在页内的开始位置。

不过sys.fn_PhysLocFormatter格式化显式的槽号并不是如下截图的偏移量，而是第N个数据行的这个N的信息，因此第1行的槽号就是1，第2行的槽号就是2，以此类推，当第一个page存储满之后，从第二个page开始存储，槽号又从0开始编号且累加

至此，对SQL Server的伪列，也就说经常说的RowId有了一个简单的认识。

这里可以认为，在SQL Server数据库中，伪列RowId就是数据行的物理地址，至于别的数据库中的伪列（RowId）是不是物理地址倒是不确定（很有可能也是的）

这里简单提一下一开始说的一个问题：
为什么SQL Server的聚集表（有聚集索引的表）存储数据的时候存储的是“索引键值+聚集索引键值”,对于非聚集索引表，索引存储的是索引键值+RowId？

或者反过来说，为什么聚集索引表的非聚集索引存储的是“索引键值+聚集索引键值”而不是“索引存储的是索引键值+RowId”

作为一个常识，聚集索引要按照聚集索引的顺序存放，这就意味着聚集索引表的行数据物理位置有可能发生变化，比如在众所周知的“页拆分（page split）”中发生变化，在数据行的物理位置发生了变化的时候，如果非聚集索引存储的是索引键值+RowId，那么这个RowId也势必要发生变化，这个变化当然要耗费一定的性能，为了防止此种情况的发生，聚集表中的非聚集索引存储成相对不变的索引键值+聚集索引键值，因为在数据行的物理位置发生变化的时候，聚集索引键值是相对不变的，这一点也不难理解。

当然有一种例外，当对聚集索引表做更新的时候，直接更新聚集索引的键值，这样的话，也有可能造成聚集索引表中当前数据行的物理位置发生变化，这一点也比较有意思，就不展开叙述了。

这一点跟绕口令一样，这里要求对SQL Server中的聚集索引和非聚集索引，以及存储结构有一个基础的认识才容易理解。

最后高能预警

高能预警，别说我瞎比比误导人，上述解析伪列的函数sys.fn_PhysLocFormatter是一个未公开的函数，未公开的函数就有可能潜在一些问题，事实上这个函数有一个非常严重的bug。

该bug就是在解析物理存储位置的时候有一定的逻辑错误，这个问题早有细心的人分析过了

参考：http://www.jb51.net/article/124109.htm

目前测试来看，在SQL Server 2014中仍然存在bug，N前年啃书的时候就了解到有这么一个函数，但是一直不想提及sys.fn_PhysLocFormatter这个函数的原因，因此对于未公开的函数，请不要做验证性测试，再次声明：该函数有bug，请谨慎使用。

附上这个函数的源代码，并参考原文的结论

create function sys.fn_PhysLocFormatter (@physical_locator binary (8))
 returns varchar (128)
as
 begin
 declare @page_id binary (4)
 declare @file_id binary (2)
 declare @slot_id binary (2)
 -- Page ID is the first four bytes, then 2 bytes of page ID, then 2 bytes of slot
 --
 select @page_id = convert (binary (4), reverse (substring (@physical_locator, 1, 4)))
 select @file_id = convert (binary (2), reverse (substring (@physical_locator, 5, 2)))
 select @slot_id = convert (binary (2), reverse (substring (@physical_locator, 7, 2)))
 return '(' + cast (cast (@file_id as int) as varchar) + ':'
 + cast (cast (@page_id as int) as varchar) + ':'
 + cast (cast (@slot_id as int) as varchar) + ')'
 end

问题出在reverse函数上。

reverse函数的作用是字符反转，而不是字节反转，当遇到81-FE之间的字节时，被认为是双字节字符而组合在一起参与反转操作，造成了错误。

总结

本文简单阐述了SQL Server中的伪列，以及伪列的含义，通过伪列对非聚集索引以及数据行的存储结构有一个简单的了解。

好了，以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对我们的支持。

SQL Server数据库中伪列及伪列的含义详解

SQL Server中的伪列下午看QQ群有人在讨论(非聚集)索引的存储,说,对于聚集索引表,非聚集索引存储的是索引键值+聚集索引键值:对于非聚集索引表,索引存储的是索引键值+RowId,这应该是一个常识,对此不作具体详细阐述. 这里主要是提到的RowId引起了一点思考. 那么,这个RowId是个什么玩意?能不能更加直观一点来看看RowId的信息?代表什么含义?这个当然也是可以的. Oracle中的表中有一个伪列的概念,就是在查询表的时候加上select rowid,* from Table,会
C#实现Excel表数据导入Sql Server数据库中的方法

本文实例讲述了C#实现Excel表数据导入Sql Server数据库中的方法.分享给大家供大家参考,具体如下: Excel表数据导入Sql Server数据库的方法很多,这里只是介绍了其中一种: 1.首先,我们要先在test数据库中新建一个my_test表,该表具有三个字段tid int类型, tname nvarchar类型, tt nvarchar类型 (注意:my_test表中的数据类型必须与Excel中相应字段的类型一致) 2. 我们用SELECT * FROM OPENROWSET(
SQL Server数据库中批量导入数据的四种方法总结

在软件项目实施的时候,数据导入一直是项目人员比较头疼的问题.其实,在SQL Server中集成了很多成批导入数据的方法.有些项目实施顾问头疼的问题,在我们数据库管理员眼中,是小菜一碟.现在的重点就是,如何让用户了解这些方法,让数据导入变得轻松一些. 第一:使用Select Into语句若企业数据库都采用的是SQL Server数据库的话,则可以利用Select Into语句来实现数据的导入.Select Into语句,他的作用就是把数据从另外一个数据库中查询出来,然后加入到某个用户指定的表中.
C#将图片存放到SQL SERVER数据库中的方法

本文实例讲述了C#将图片存放到SQL SERVER数据库中的方法.分享给大家供大家参考.具体如下: 第一步: //获取当前选择的图片 this.pictureBox1.Image = Image.FromStream(this.openFileDialog1.OpenFile()); //获取当前图片的路径 string path = openFileDialog1.FileName.ToString(); //将制定路径的图片添加到FileStream类中 FileStream fs = ne
SQL Server数据库中批量导入数据的2种方法

在软件项目实施的时候,数据导入一直是项目人员比较头疼的问题.其实,在SQL Server中集成了很多成批导入数据的方法.有些项目实施顾问头疼的问题,在我们数据库管理员眼中,是小菜一碟.现在的重点就是,如何让用户了解这些方法,让数据导入变得轻松一些.相信以下方法大家都用过了,温故而知新哈,如果有更好的方法希望大家都提出来~ 一.使用Select Into语句若企业数据库都采用的是SQL Server数据库的话,则可以利用Select Into语句来实现数据的导入.Select Into语句,他的
Sql Server 数据库中调用dll文件的过程

1.首先新建一个空的解决方案,并添加一个类库,代码如下,编译并生产dll using System; using System.Collections.Generic; using System.Data.SqlTypes; using System.Linq; using System.Text; namespace TEST { public class TestTrans { [Microsoft.SqlServer.Server.SqlFunction] public static Sq
sql server数据库中raiserror函数用法的详细介绍

sql server数据库中raiserror函数的用法 server数据库中raiserror的作用就和asp.NET中的throw new Exception一样,用于抛出一个异常或错误.这个错误可以被程序捕捉到. raiserror的常用格式如下: raiserror('错误的描述',错误的严重级别代码,错误的标识,错误的描述中的参数的值(这个可以是多个),一些其它参数),在官方上的格式描述如下: RAISERROR ( { msg_id | msg_str | @local_variab
在SQL Server数据库中为标识(IDENTITY)列插入显式值

如果我们在标识列中插入值,例如: insert member(id,username) values(10,'admin') 则在查询分析器里面会返回错误信息: 引用内容服务器: 消息 544,级别 16,状态 1,行 1 当 IDENTITY_Insert 设置为 OFF 时,不能向表 'member' 中的标识列插入显式值. 而在ASP程序中会返回错误信息: 引用内容 Microsoft OLE DB Provider for SQL Server 错误 '80040e14' 当 ID
SQL Server数据库中的存储过程介绍

什么是存储过程如果你接触过其他的编程语言,那么就好理解了,存储过程就像是方法一样. 竟然他是方法那么他就有类似的方法名,方法要传递的变量和返回结果,所以存储过程有存储过程名有存储过程参数也有返回值. 存储过程的优点: 存储过程的能力大大增强了SQL语言的功能和灵活性. 1.可保证数据的安全性和完整性. 2.通过存储过程可以使没有权限的用户在控制之下间接地存取数据库,从而保证数据的安全. 3.通过存储过程可以使相关的动作在一起发生,从而可以维护数据库的完整性. 4.在运行存储过程前,数据库已对其
SQL Server数据库中的表名称、字段比较

前言项目中一般分测试环境(QAS),生产环境(PRD),当我们的项目经历了一次周期跨度较长的更新后,当我们发布到生产环境时,首要的任务是将新增的表,字段更新到生产数据库.很多时候,当我们发布更新的时候,已经很难记得做了哪些变更. 当然有的人会说,1.EF Code First 有history记录,这是一种办法,可靠么?不可靠.相信即便是用Code First,直接改数据库的肯定不止我一个. 2.查看实体类变更记录,这也是一个办法.那如果用的DB First的呢?当然也可以看,就是很麻烦. 3

SQL Server数据库中伪列及伪列的含义详解

相关推荐

随机推荐