SQL Server 数据库分区分表（水平分表）详细步骤

2025-03-31 14:30:37

1、需求说明

将数据库Demo中的表按照日期字段进行水平分区分表。要求数据文件按一年一个文件存储，且分区的分割点会根据时间的增长自动添加（例如现在是2017年1月1日，将其作为一个分割点，即将2017年1月1日之前的数据存储到数据文件A中，将2017年1月1日的之后的数据存储到数据文件B中；当时间到2018年1月1日时，自动将2018年1月1日添加为一个新的分区分割点，并将2017年1月1日至2018年1月1日的数据存储在数据文件B中，将2018年1月1日之后的数据存储在一个新的数据文件C中，以此类推）。

2、实现思路

2.1分区原理

要实现这一功能，首先要了解数据库对水平分区表进行分区存储的原理。

所谓水平分区分表，就是把逻辑上的一个表，在物理上按照你指定的规则分放到不同的文件里，把一个大的数据文件拆分为多个小文件，还可以把这些小文件放在不同的磁盘下。这样把一个大的文件拆分成多个小文件，便于我们对数据的管理。

2.2 水平分区优点

l 便于存档

l 便于管理：备份恢复时可以单一的备份或者恢复某一个分区

l 提高可用性：一个分区故障，不影响其他分区的正常使用

l 提高性能：提升查询数据的速度

2.3 实现思路

① 创建数据库

② 在创建的数据库中添加文件组

③ 在文件组中添加新的文件

④ 定义分区函数

⑤ 定义分区架构

⑥ 定义分区表

⑦ 定义代理作业，自动添加分区分割点

⑧ 测试数据

注意：

² 分区表依赖于分区架构，而分区架构又依赖与分区函数，所以在穿件分区函数、分区架构、分区表是要按照对应的顺序创建。

² 分区函数并不属于具体的分区架构和分区表，它们之间仅仅是使用关系。

² 分区表只能在创建的时候指定为分区表

3、实现步骤

3.1代码创建分区表

3.1.1 创建数据库

新建数据库，并将其命名为Demo

3.1.2 添加文件组

代码格式：

ALTER DATABASE <数据库名称> ADD FILEGROUP<文件组名>

代码示例：

ALTER DATABASE DemoADD FILEGROUP DemoFileGroup

3.1.3 添加文件

代码格式：

ALTER DATABASE <数据库名称> ADD FILE <数据标识> TO FILEGROUP<文件组名称>

注意：数据标识中name为逻辑文件名、filename为物理文件路径名、size为文件初始大小（单位：kb/mb/gb/tb）、filegrowth为文件自动增量（单位：kb/mb/gb/tb）、maxsize为文件增大的最大大小（单位：kb/mb/gb/tb/unlimited）

代码示例：

ALTER DATABASEDemo ADD FILE (
 NAME='DemoFile1',
FILENAME='D:\ProgramFiles\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\DATA\DemoFile1.mdf',
 SIZE=5MB,
 FILEGROWTH=5MB)
 TOFILEGROUP DemoFileGroup

在此我们重复执行示例代码，在示例文件组下添加三个文件。

3.1.4 定义分区函数

分区函数是用于判定数据行该属于哪个分区,通过分区函数中设置边界值来使得根据行中特定列的值来确定其分区。

代码格式：

CREATE PARTITIONFUNCTION partition_function_name( input_parameter_type )

ASRANGE [ LEFT | RIGHT ]

FORVALUES ( [ boundary_value [ ,...n ] ] )

[ ; ]

其中“LEFT”和“RIGHT”决定了“VALUES”中的边界值被划分到哪一个分区中（即，边界值属于左侧分区还是右侧分区）。

代码示例：

CREATE PARTITIONFUNCTION DemoPartitionFunction( datetime2(0) )
 ASRANGE RIGHT
 FORVALUES ('2016-01-01 00:00:00','2017-01-01 00:00:00')

查看分区函数是否创建成功：

SELECT * FROM sys.partition_functions

3.1.5 定义分区架构

定义完分区函数仅仅是知道了如何将列的值区分到了不同的分区，而每个分区的存储方式，则需要分区构架来定义。分区构架仅仅是依赖分区函数.分区构架中负责分配每个区属于哪个文件组，而分区函数是决定如何在逻辑上分区。

代码格式：

CREATE PARTITIONSCHEME partition_scheme_name

ASPARTITION partition_function_name

[ ALL ]TO ( { file_group_name | [ PRIMARY ] } [ ,...n ] )

[ ; ]

代码示例：

CREATE PARTITIONSCHEME DemoPartitionScheme
 ASPARTITION DemoPartitionFunction
 TO ( DemoFileGroup,[PRIMARY],DemoFileGroup)

查看分区架构是否创建完成：

SELECT * FROM sys.partition_schemes

3.1.6 定义分区表

表在创建的时候就已经决定是否是分区表了。虽然在很多情况下都是你在发现已经表已经足够大的时候才想到要把表分区，但是分区表只能够在创建的时候指定为分区表。

代码格式：

CREATE TABLEtable_name(

...

) ONpartition_scheme_name(column_name)

代码示例：

CREATE TABLEDemoTable(
demo_id BIGINT,
demo_date datetime2(0),
demo_desc varchar(50)
) ONDemoPartitionScheme(demo_date)

3.2 界面向导表分区

在3.4、3.5、3.6中，我们已经详细的描述了如何定义分区函数、分区架构以及分区表，但这些都是通过代码实现的，下面，我们来通过SQL Server 2012 Management Studio的界面向导创建分区表。

3.2.1 创建数据库

右键点击“数据库”，选择第一项“新建数据库(N)…”，新建数据库，如图1所示：

图1 新建数据库

3.2.2 创建文件组

右键数据库Demo，选择“属性”，如图2所示：

图2 数据库属性界面

在属性界面中，点击箭头所示的“文件组”选项，进入文件组编辑界面，如图3所示：

图3 文件组管理界面

在文件组管理界面中点击箭头①所示的“添加”选项，添加新的文件组，界面中会出现箭头②所示的属性框，并键入对应的属性值，之后点击“确定”，完成新建文件组。

3.2.3 添加文件

和添加文件组的方式一样，右键数据库Demo，选择“属性”，打开数据库属性界面，这次选择“文件”，打开文件管理界面，如图4所示：

图4 文件管理界面

在文件管理界面中，点击箭头①所示的“添加”选项，添加新的文件，在新添加的箭头②所示的区域，根据实际需求，填写对应的文件属性值，填写完成后点击“确定”。其中，一个文件组中可以添加多个文件，即“文件组”属性的值是可以重复的。

3.2.4 定义分区表

在SQL Server 2012 Management Studio的界面中，找到目标数据库下的“表”菜单，右键点击，选择“新建数据库表”，打开新建数据库表界面，新建一个分区表。如图5所示：

图5 新建数据库表

3.2.5 添加分区函数和分区架构

完成新建分区表后，我们就可以在分区表上添加分区函数和分区架构了。右键点击分区表，选择“存储”，然后选择“创建分区”，开始添加分区函数和分区架构，如图6所示：

图6 新建分区界面

点击“下一步”，如图7所示：

图7 选择分区列

在图7所示的界面中，勾选分区列，勾选完成后，选择“下一步”，如图8所示：

图8 填写分区函数

在图8所示的界面填写分区函数名称，填写完成后点击“下一步”，如图9所示：

图9 填写分区架构

在图9所示的界面中填写需要创建的分区架构的名称，填写完成后点击“下一步”，如图10所示：

图10 指定文件组

如图10所示，按照图示箭头步骤，一步步设置文件组参数。首先选择分区边界值划分在左边界分区还是右边界分区，然后进行第二步，设置分区所属文件组，再设置分区边界值（该值要与分区表的分区字段类型对应），最后点击“预计存储空间(E)”对其他参数进行自动填充。设置完成后点击“下一步”，如图11所示：

图11 脚本设置

在图11所示的界面中，根据实际需求完成最后的设置(一般不做设置)，然后点击“完成”，在下一个界面中再次点击“完成”，然后等待数据库执行操作，最后关闭界面。

分区完成后，右键点击分区表，选择“属性”，然后选择“存储”，打开如图12所示界面：

图12 表分区查看

从图12中可以看到数据库表已经完成分区。

3.3 动态添加分割点

要完成动态的向分区函数中添加分割点的功能，首先我们来理一下思路：首先我们要向文件组中添加一个新的文件或者直接添加一个新的文件组，添加完成后，需要修改分区架构，来告知数据库新分的分区数据存储到那个文件或者文件组中，最后在分区函数中添加新的分割点，完成动态添加分区分割点的功能。

根据这个思路，我编写的了一个存储过程，用于动态的添加分割点：

CREATE proc[dbo].[Demo_FileGroup_Add]
as
declare
@file_name varchar(20),--要添加的文件名称
@add_sql nvarchar(max)--在文件组下添加新文件的SQL语句

begin  

set @file_name='DemoFile'+left((convert(varchar,(DATEADD(yy, DATEDIFF(yy,0,(DATEADD(YY,1,GETDATE()))), 0)),120)),4)--动态拼接文件名
set @add_sql='
ALTER DATABASE Demo ADD FILE (
NAME='+@file_name+',
FILENAME=''D:\ProgramFiles\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\DATA\'+@file_name+'.mdf'',
SIZE=5MB,
FILEGROWTH=5MB)
TO FILEGROUP DemoFileGroup'
--select @add_sql
Exec sp_executesql@add_sql--执行向文件组中添加文件的SQL语句

alter partitionscheme DemoPartitionSchemenext used 'DemoFileGroup' --告知数据库新建立的分区放在哪个文件组（修改分区架构）

alter partitionfunction DemoPartitionFunction() split range (CONVERT(VARCHAR,DATEADD(yy, DATEDIFF(yy,0,(DATEADD(YY,1,GETDATE()))), 0),120))--在分区函数中添加分割点

end

注意：在执行该存储过程之前，一定要确保文件组中没有即将添加的文件，并且在分区函数中，没有要添加的分割点，否则会报错，存储过程不能执行。

4、测试数据

4.1 添加测试数据

4.1.1 新建测试表

新建一个未分区的TestTable表，其表结构与分区表DemoTable表结构完全一致，代码如下：

CREATE TABLE[dbo].[TestTable](
 [demo_id][bigint],
 [demo_date][datetime2](0),
 [demo_desc][varchar](50)
)

4.1.2 编写T-SQL添加测试数据

T-SQL语句如下：

declare
@num bigint, --id
@test_date datetime2(0),--时间
@test_desc varchar(300),--描述
@count int--计数器
begin
set @num= 0 --设置初始id
set @test_date= '2015-01-01 00:00:00'--设置初始日期
set @test_desc='屈贾谊于长沙，无非明主；窜梁鸿于海曲，岂乏明时？'
while (@test_date<'2019-01-01 00:00:00') --设置日期上限
begin
     set@count = 0
     while(@count<10)--每个时间点添加10条数据
        begin
            insertinto dbo.DemoTable values(@num,@test_date,@test_desc+CAST(@count as varchar)) --添加数据
            set@count=@count+1 --计数自增
            set@num = @num +1 --id自增
        end
     set@test_date = DATEADD(MI,1,@test_date) --每一个时间点添加完10条数据后，时间自增1分
end
end

修改T-SQL语句中insert部分的表明，分别向两张表中添加测试数据，添加21038400行数据，结果如下：

图13 分区表插入数据耗时统计

图14 分区表存储信息

图15 普通表插入数据耗时统计

图16 普通表存储信息

从图13与图15中可以看出，同样插入21038400行数据，分区表耗时3740秒，普通表耗时3920秒，分区表快4.6%。考虑到运行环境对测试数据的影响，在此我们先对此数据不做评价，毕竟4.6%不是很明显。

而从图14与图16的对比中可以看出，分区表的索引空间为0.125MB，而普通表的索引空间为0.008MB。那么为什么分区表的索引空间要比普通表的索引空间大呢？其实这个问题个人理解大致是：创建分区表就是将数据存储在不同的文件中，然后数据库会根据分区函数和分区架构，以分区列为索引列，创建分区索引来管理数据存放的位置，所以分区表的索引空间理所当然会比普通标表的索引空间大。

默认情况下，分区表中创建的索引使用与分区表相同分区架构和分区列，这样，索引将于表对齐。将表与其索引对齐，可以使管理工作更容易进行，对于滑动窗口方案尤其如此。若要启动分区切换，表的所有索引都必须对齐。

在创建索引时，也可以指定不同的分区方案（Schema）或单独的文件组（FileGroup）来存储索引，这样SQL Server 不会将索引与表对齐。

在已分区的表上创建索引（分区索引）时，应该注意以下事项：

l 唯一索引

建立唯一索引（聚集或者非聚集）时，分区列必须出现在索引列中。此限制将使SQL Server只调查单个分区，并确保表中宠物的新键值。如果分区依据列不可能包含在唯一键中，则必须使用DML触发器，而不是强制实现唯一性。

l 非唯一索引

对非唯一的聚集索引进行分区时，如果未在聚集键中明确指定分区依据列，默认情况下SQL Server 将在聚集索引列中添加分区依据列。

对非唯一的非聚集索引进行分区时，默认情况下SQL Server 将分区依据列添加为索引的包含性列，以确保索引与基表对齐，若果索引中已经存在分区依据列，SQL Server 将不会像索引中添加分区依据列。

5、补充说明

5.1 分区分表理解

分区分表分为垂直分区分表和水平分区分表，根据我自己查阅资料，总结如下：

垂直分区分表是在SQL Server 2005之前大量使用的，垂直分表相对很少见到和用到，因为这可能是数据库设计上的问题了。如果数据库中一张表有部分字段几乎从不不更改但经常查询，而部分字段的数据频繁更改，这种设计放到同一个表中就不合理了，相互影响太大了。在已存在改情况的表的时候，可以考虑按列拆分表，即垂直拆分。拆分完成后，通过分表之间设置外键关联，然后创建视图和触发器等对表进行增、删、改、查操作。

而水平分区分表是SQL Server2005之后被大量使用的。其原理就是将逻辑上的一个表，在物理上拆分，将数据存储在不同的文件组中，这个我们前边已经讲过了，这里就不在赘述。

5.2 水平分区分表疑惑

在自己学习水平分区分表的过程中发现一个问题，描述如下：

在创建分区表的时候，似乎可以将不同分区的数据存放在同一个文件组下的不同文件中，也可以将不同分区的数据分别存放在不同的文件组，那么这两种存储数据的方式对数据查询的性能有影响吗？

这个问题我觉得可以做一个小小的测试。

5.3 其它说明

学习是永无止境的，这篇文章只是我个人在学习SQL Server水平分区分表的时候做的一些总结，其中添加了一些个人理解，如果有不对的地方，欢迎与我交流，大家相互学习，共同进步。

SQL Server 数据库分区分表（水平分表）详细步骤

1. 需求说明将数据库Demo中的表按照日期字段进行水平分区分表.要求数据文件按一年一个文件存储,且分区的分割点会根据时间的增长自动添加(例如现在是2017年1月1日,将其作为一个分割点,即将2017年1月1日之前的数据存储到数据文件A中,将2017年1月1日的之后的数据存储到数据文件B中:当时间到2018年1月1日时,自动将2018年1月1日添加为一个新的分区分割点,并将2017年1月1日至2018年1月1日的数据存储在数据文件B中,将2018年1月1日之后的数据存储在一个新的数据文件C中,
SQL SERVER数据库表记录只保留N天图文教程

本文通过图文并茂的方式给大家展示SQL SERVER数据库表记录只保留N天图文教程,具体方法步骤请看下文: 第一步:首先设置SQL Server 代理服务为自动启动: "开始"-->"控制面板"-->"管理工具"-->"服务"-->右键" SQL SERVER 代理"-->"属性"-->"启动类型",选择 "自动启动 &q
C#实现Excel表数据导入Sql Server数据库中的方法

本文实例讲述了C#实现Excel表数据导入Sql Server数据库中的方法.分享给大家供大家参考,具体如下: Excel表数据导入Sql Server数据库的方法很多,这里只是介绍了其中一种: 1.首先,我们要先在test数据库中新建一个my_test表,该表具有三个字段tid int类型, tname nvarchar类型, tt nvarchar类型 (注意:my_test表中的数据类型必须与Excel中相应字段的类型一致) 2. 我们用SELECT * FROM OPENROWSET(
SQL Server数据库按百分比查询出表中的记录数

SQL Server数据库查询时,能否按百分比查询出记录的条数呢?答案是肯定的.本文我们就介绍这一实现方法. 实现该功能的代码如下: create procedure pro_topPercent ( @ipercent [int] =0 --默认不返回 ) as begin select top (@ipercent ) percent * from books end 或 create procedure pro_topPercent ( @ipercent [int] =0 ) as be
Mysql的水平分表与垂直分表的讲解

在我上一篇文章中说过,mysql语句的优化有局限性,mysql语句的优化都是围绕着索引去优化的,那么如果mysql中的索引也解决不了海量数据查询慢的状况,那么有了水平分表与垂直分表的出现(我就是记录一下自己的理解) 水平分表: 如上图所示:另外三张表表结构是一样的只不过把数据进行分别存放在这三张表中,如果要insert 或者query 那么都需要对id进行取余然后table名进行拼接,那么就是一张完整的table_name 但是如果我需要对name进行分表呢或者对email呢? 那么就需
EFCore 通过实体Model生成创建SQL Server数据库表脚本

在我们的项目中经常采用Model First这种方式先来设计数据库Model,然后通过Migration来生成数据库表结构,有些时候我们需要动态通过实体Model来创建数据库的表结构,特别是在创建像临时表这一类型的时候,我们直接通过代码来进行创建就可以了不用通过创建实体然后迁移这种方式来进行,其实原理也很简单就是通过遍历当前Model然后获取每一个属性并以此来生成部分创建脚本,然后将这些创建的脚本拼接成一个完整的脚本到数据库中去执行就可以了,只不过这里有一些需要注意的地方,下面我们来通过代码来一
PHP操作SQL Server数据库实现表的改查与统计

目录今天上午做表格数据的检查与修改,涉及到PHP对MS SQL Server数据表的查询.统计与修改. 平时我也不记编码和命令,到了用的时候都再查手册,这往往很耗费时间,现在写博客有个好处就是把有用的代码记录下来,下次就直接复制,修改一下就直接用了. 这样可以省去很多时间. 下面是检索三个表来更新数据,即主表有信息不全,检索两个其他的信息表进行补录. <?php require 'pspLinkConfig.php';//加载数据库 $sql = "select C24 from cwk
详解SQL Server数据库链接查询的方式

SQL Server数据库链接查询的方式的相关知识是本文我们主要要介绍的内容,我们知道,通过连接运算符可以实现多个表查询.连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志.多表连接查询是使用Sql的基本操作,但连接的方式却有多种,熟练使用这些连接方式能够简化Sql语句,提高数据库运行效率. 在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中.当检索数据时,通过连接操作查询出存放在多个表中的不同实体的信息.连接操作给用户带来很
使用sharding-jdbc实现水平分表的示例代码

目录在mysql中新建数据库sharding_db,新增两张结构一样的表student_1和student_2. 添加依赖编写配置文件编写实体类编写mapper接口编写测试类执行测试在mysql中新建数据库sharding_db,新增两张结构一样的表student_1和student_2. CREATE TABLE `student_1` ( `ID` bigint(20) NOT NULL , `NAME` varchar(50) CHARACTER SET utf8mb4 CO
springboot实现以代码的方式配置sharding-jdbc水平分表

目录关于依赖 shardingsphere-jdbc-core-spring-boot-starter shardingsphere-jdbc-core 数据源DataSource 原DataSource ShardingJdbcDataSource 完整的ShardingJdbcDataSource配置分表策略主要的类其他的分表配置类 groovy行表达式说明 properties配置 Sharding-jdbc的坑结语多数项目可能是已经运行了一段时间,才开始使用sharding-

SQL Server 数据库分区分表（水平分表）详细步骤

1、 需求说明

2、实现思路

2.1分区原理

2.2 水平分区优点

2.3 实现思路

3、实现步骤

3.1代码创建分区表

3.1.1 创建数据库

3.1.2 添加文件组

3.1.3 添加文件

3.1.4 定义分区函数

3.1.5 定义分区架构

3.1.6 定义分区表

3.2 界面向导表分区

3.2.1 创建数据库

3.2.2 创建文件组

3.2.3 添加文件

3.2.4 定义分区表

3.2.5 添加分区函数和分区架构

3.3 动态添加分割点

4、测试数据

4.1 添加测试数据

4.1.1 新建测试表

4.1.2 编写T-SQL添加测试数据

5、补充说明

5.1 分区分表理解

5.2 水平分区分表疑惑

5.3 其它说明

相关推荐

随机推荐

1、需求说明