sql server中的任务调度与CPU深入讲解

一. 概述

我们知道在操作系统看来, sql server产品与其它应用程序一样,没有特别对待。但内存,硬盘,cpu又是数据库系统最重要的核心资源,所以在sql server 2005及以后出现了SQLOS,这个组件是sqlserver和windows的中间层,用于CPU的任务调度,解决I/O的资源争用,协调内存管理等其它的资源协调工作。下面我来试着讲讲SQLOS下的Scheduler调度管理。话不多说了,来一起看看详细的介绍吧。

二. CPU 的配置

在Sql server 里点击数据库实例右键到属性,选择处理器进行配置。最大工作线程数的默认值是0 (注意这里配置的是worker它是对CPU的真正封装)。这使得SQL Server能够在启动时自动配置工作线程的数量。默认设置对于大多数系统是最好的。但是,根据您的系统配置,将最大工作线程数设置为一个特定的值有时会提高性能。当查询请求的实际数量小于最大工作线程数时,一个线程处理一个查询请求。但是,如果查询请求的实际数量超过最大线程量时,SQLServer会将Worker Threads线程池化,以便下一个可用的工作线程可以处理请求。

配置如下图所示:

也可以通过T-sql配置,下例通过sp_configure将max worker线程选项配置为900

USE AdventureWorks2012 ;
GO
EXEC sp_configure 'show advanced options', 1;
GO
RECONFIGURE ;
GO
EXEC sp_configure 'max worker threads', 900 ;
GO
RECONFIGURE;

Max Worker Threads服务器配置选项不考虑的线程, 像高可用、Service Broker、 Lock 管理等其它。如果配置的线程数量超过了,下面的查询将提供关于系统任务产生的额外线程信息

is_user_process = 0 表示系统任务,非用户任务。

SELECT s.session_id, r.command, r.status, r.wait_type, r.scheduler_id, w.worker_address,
w.is_preemptive, w.state, t.task_state, t.session_id, t.exec_context_id, t.request_id
FROM sys.dm_exec_sessions AS s
INNER JOIN sys.dm_exec_requests AS r
ON s.session_id = r.session_id
INNER JOIN sys.dm_os_tasks AS t
ON r.task_address = t.task_address
INNER JOIN sys.dm_os_workers AS w
ON t.worker_address = w.worker_address
WHERE s.is_user_process = 0;

下面显示每个用户的活动会话数

SELECT login_name ,COUNT(session_id) AS session_count
FROM sys.dm_exec_sessions
WHERE status<>'sleeping'
GROUP BY login_name; 

下表显示了各种CPU和SQLServer组合的最大工作线程的自动配置数量。


Number of CPUs


32-bit computer


64-bit computer


<= 4 processors


256


512


8 processors


288


576


16 processors


352


704


32 processors


480


960


64 processors


736


1472


128 processors


4224


4480


256 processors


8320


8576

根据微软的建议:这个选项是一个高级选项,应该只由经验丰富的数据库管理员或经过认证的SQL Server专业人员更改。如果您怀疑存在性能问题,则可能不是工作线程的可用性。原因更像是I/O,这会导致工作线程等待。在更改最大工作线程设置之前,最好找到性能问题的根本原因。

二.调度原理

2.1 Scheduler任务调度

Sqlserver 的一个Scheduler对应操作系统上的一个逻辑CPU用于任务分配。调度分配从NUMA节点级别开始。基本算法是一个用于新连接的循环调度。当每个新的连接到达时,它被分配给基于循环的调度器。在相同的NUMA节点内,以最小的负载因子分配给调度器的新连接。

2.2  Worker

Worker又称为WorkerThread,每个Worker跟一个线程,是Sql server任务的执行单位。 多个Worker对应一个Scheduler,公式Workers=max worker threads/onlines scheduler。在一个Scheduler上,同一时间只能有一个Worker运行。例如4个处理器的64位操作系统,它的每个Scheduler的Worker是512/4=128。

2.3  Task

在Worker上运行的最小任务单元。最简单的Task就是一个简单的Batch,当一个会话发出一个请求时,Sql server会把这个请求拆分一个或多个任务(Tasks),然后关联对应个数的工作者线程(worker thread)。

例如下面是二个Task ,二个Task可能不是同一个Worker。二个Worker也可能不是同一个Scheduler.

select @@servername
Go
select getdate()
GO

每个Task线程都有3个状态:

  • Running: 一个处理器在某个时间只能做一件事情,当一个线程正在一个处理器上运行时,这个线程的状态就是running。
  • Suspended: 没有足够资源时,当前线程放弃占有处理器,变成挂起状态。
  • Runnable: 一个线程已完成了等待,但还没有轮到它运行,就会变成runnable状态,这种信号等待(signal wait)

2.4 Yielding

Yelding就是所有逻辑scheduler上运行的Worker都是非抢占式的, 在 Scheduler上Worker由于资源等待,让出给其它Worker就叫Yielding。

下面讲述几种发生的状态:

  1. 当Woker在Scheduler上运行了超过4ms,就做Yielding。

  2. 每做64k的结果集的排序,就会做一次Yielding。

  3. 做语句Complie编译的过程中,这个过程比较占CPU资源时,经常会有Yielding等。

2.5 调度关系图如下:

2.5  Task在调度运行图如下:

                 

1. 当 Task 是Runnig时,它是Schedler的活动Worker。

2. 当 Task只等待CPU运行时,它被放入Schedler可运行的队列中。

3. 当 Task 在等待某个资源时(比如锁、磁盘输入/输出等)时,它处于“Suspended挂起状态” 状态。

4. 如果Task Scheduler挂起状态完成了等待,那么它就会被放到Scheduler 的Runnable队列的末尾。

5. 如果运行线程自动Yidlding让步,则将其放回Scheduler 的Runnable队列的末尾。

6. 如果运行的线程需要等待某个资源,它将被调出Scheduler调度器并进入挂起状态Waiter list。

7. 如果正在运行的线程完成它的工作,那么Runnable队列的顶部的第一个线程就变成了“运行”线程。

三. 使用dmv任务查看

3.1.  通过sys.dm_os_sys_info 查看scheduler与cpu的关系如下:

 SELECT cpu_count,max_workers_count,scheduler_count FROM sys.dm_os_sys_info

  

3.2  查看最大Worker数  

select max_workers_count from sys.dm_os_sys_info  

3.3  查看Task与Worker关系

--在每一个连接里,我们可能会有很多batch,分解成多个task以支持如并行查询
 select task_address,task_state,scheduler_id,session_id,worker_address
 from sys.dm_os_tasks where session_id>50

select state,last_wait_type,tasks_processed_count,task_address, worker_address, scheduler_address
 from sys.dm_os_workers where worker_address =0x00000000043621A0

3.4 查看Scheduler

--scheduler_id<255 代表用户CPU,相反代表SYSTEM SCHEDULER
SELECT
 scheduler_id,
 cpu_id,
 is_online,
 current_tasks_count,
 runnable_tasks_count,
 current_workers_count,
 active_workers_count,
 work_queue_count
 FROM sys.dm_os_schedulers
 WHERE scheduler_id < 255

cpu_id:关联的cpu 。 CPU ID  >=255 这类Scheduler都用于系统内部使用。比如说资源管理、DAC、备份还原操作等。

  is_online: 0 调度器离线,1 在线。

  current_tasks_count:当前任务数,状态包括:(等待,运行,已完成)。

  runnable_tasks_count:以分配任务,并在可运行队列中等待被调度的任务数,使用率不高的情况下,这个值会是0。

  current_workers_count:此scheduler关联的线程数。包括处于空闲状态的线程work。

  active_workers_count:当前处理活动的线程数,它必须关联任务task,包括running,runnable,suspend。

  work_queue_count:队列中的任务task等待数,如果不为0,意味着线程用尽的压力。

讲到这里,后面讲讲CPUf过高的分析...

参考文献:

  Troubleshooting SQL Server Scheduling and Yielding

  Microsoft SQL Server企业级平台管理实践

  How It Works: SQL Server 2012 Database Engine Task Scheduling

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

(0)

相关推荐

  • 基于SQL Server OS的任务调度机制详解

    简介 SQL Server OS是在Windows之上,用于服务SQL Server的一个用户级别的操作系统层次.它将操作系统部分的功能从整个SQL Server引擎中抽象出来,单独形成一层,以便为存储引擎提供服务.SQL Server OS主要提供了任务调度.内存分配.死锁检测.资源检测.锁管理.Buffer Pool管理等多种功能.本篇文章主要是谈一谈SQL OS中所提供的任务调度机制. 抢占式(Preemptive)调度与非抢占式(non-Preemptive)调度 数据库层面的任务调度的

  • SQL Server 2008 R2占用cpu、内存越来越大的两种解决方法

    SQL Server 2008 R2运行越久,占用内存会越来越大. 第一种: 有了上边的分析结果,解决方法就简单了,定期重启下SQL Server 2008 R2数据库服务即可,使用任务计划定期执行下边批处理: net stop sqlserveragent net stop mssqlserver net start mssqlserver net start sqlserveragent 第二种: 进入Sql server 企业管理器(管理数据库和表的,这个都不知道就不用往下看了),在数据库

  • SQL Server误区30日谈 第12天 TempDB的文件数和需要和CPU数目保持一致

    误区 #12:TempDB的文件数和需要和CPU数目保持一致 错误 哎,由于上述误区是微软"官方"的建议,并且还有大量博文坚持这个观点,这个误区已经是老生常谈. 但让人困惑的是SQL CAT团队给出的建议就是1:1,但这个建议是源自扩展方面的原理来说,而不是一个通用法则.因为他们所面对的大型客户数据量服务器和IO子系统都是大部分人没有机会遇到的. 每个实例仅仅允许有一个TempDb,但需要用到TempDB的地方却有很多,所以TempDB很容易成为性能瓶颈,我想大家数人都了解这一点,而大

  • SqlServer如何通过SQL语句获取处理器(CPU)、内存(Memory)、磁盘(Disk)以及操作系统相关信息

    在SQL SERVER中如何通过SQL语句获取服务器硬件和系统信息呢?下面介绍一下如何通过SQL语句获取处理器(CPU).内存(Memory).磁盘(Disk)以及操作系统相关信息.如有不足和遗漏,敬请补充.谢谢! 一:查看数据库服务器CPU的信息 ---SQL 1:获取数据库服务器的CPU型号 EXEC xp_instance_regread 'HKEY_LOCAL_MACHINE', 'HARDWARE\DESCRIPTION\System\CentralProcessor\0', 'Pro

  • 我的服务器SQL2000的sqlserver占用了90%的cpu,怎么查是那个库?

    您可以在服务器上,企业管理器中,将一个个库脱机,就知道是那个造成了.对于不能脱机的库,可以先停止它的网站.

  • sql server中的任务调度与CPU深入讲解

    一. 概述 我们知道在操作系统看来, sql server产品与其它应用程序一样,没有特别对待.但内存,硬盘,cpu又是数据库系统最重要的核心资源,所以在sql server 2005及以后出现了SQLOS,这个组件是sqlserver和windows的中间层,用于CPU的任务调度,解决I/O的资源争用,协调内存管理等其它的资源协调工作.下面我来试着讲讲SQLOS下的Scheduler调度管理.话不多说了,来一起看看详细的介绍吧. 二. CPU 的配置 在Sql server 里点击数据库实例右

  • sql server中错误日志errorlog的深入讲解

    一 .概述 SQL Server 将某些系统事件和用户定义事件记录到 SQL Server 错误日志和 Microsoft Windows 应用程序日志中. 这两种日志都会自动给所有记录事件加上时间戳. 使用 SQL Server 错误日志中的信息可以解决SQL Server的相关问题. 查看 SQL Server 错误日志可以确保进程(例如,备份和还原操作.批处理命令或其他脚本和进程)成功完成. 此功能可用于帮助检测任何当前或潜在的问题领域,包括自动恢复消息(尤其是在 SQL Server 实

  • Sql Server中通过sql命令获取cpu占用及产生锁的sql

    获取SQLSERVER中产生锁的SQL语句 SELECT SUBSTRING(st.text, (qs.statement_start_offset/2) + 1,((CASE statement_end_offset WHEN -1 THEN DATALENGTH(st.text) ELSE qs.statement_end_offset END - qs.statement_start_offset)/2) + 1) as statement_text FROM sys.dm_exec_qu

  • SQL Server中的执行引擎入门 图解

    本文旨在分类讲述执行计划中每一种操作的相关信息. 数据访问操作 首先最基本的操作就是访问数据.这既可以通过直接访问表,也可以通过访问索引来进行.表内数据的组织方式分为堆(Heap)和B树,其中表中没有建立聚集索引时数据是通过堆进行组织的,这个是无序的,表中建立聚集索引后和非聚集索引的数据都是以B树方式进行组织,这种方式数据是有序存储的.通常来说,非聚集索引仅仅包含整个表的部分列,对于过滤索引,还仅仅包含部分行. 除去数据的组织方式不同外,访问数据也分为两种方式,扫描(Scan)和查找(Seek)

  • 浅析SQL Server中的执行计划缓存(下)

    在上篇文章给大家介绍了SQL Server中的执行计划缓存(上),本文继续给大家介绍sqlserver执行计划缓存相关知识,小伙伴们一起学习吧. 简介 在上篇文章中我们谈到了查询优化器和执行计划缓存的关系,以及其二者之间的冲突.本篇文章中,我们会主要阐述执行计划缓存常见的问题以及一些解决办法. 将执行缓存考虑在内时的流程 上篇文章中提到了查询优化器解析语句的过程,当将计划缓存考虑在内时,首先需要查看计划缓存中是否已经有语句的缓存,如果没有,才会执行编译过程,如果存在则直接利用编译好的执行计划.因

  • 浅析SQL Server中的执行计划缓存(上)

    简介 我们平时所写的SQL语句本质只是获取数据的逻辑,而不是获取数据的物理路径.当我们写的SQL语句传到SQL Server的时候,查询分析器会将语句依次进行解析(Parse).绑定(Bind).查询优化(Optimization,有时候也被称为简化).执行(Execution).除去执行步骤外,前三个步骤之后就生成了执行计划,也就是SQL Server按照该计划获取物理数据方式,最后执行步骤按照执行计划执行查询从而获得结果.但查询优化器不是本篇的重点,本篇文章主要讲述查询优化器在生成执行计划之

  • 浅谈SQL Server中的三种物理连接操作(性能比较)

    在SQL Server中,我们所常见的表与表之间的Inner Join,Outer Join都会被执行引擎根据所选的列,数据上是否有索引,所选数据的选择性转化为Loop Join,Merge Join,Hash Join这三种物理连接中的一种.理解这三种物理连接是理解在表连接时解决性能问题的基础,下面我来对这三种连接的原理,适用场景进行描述. 嵌套循环连接(Nested Loop Join) 循环嵌套连接是最基本的连接,正如其名所示那样,需要进行循环嵌套,嵌套循环是三种方式中唯一支持不等式连接的

  • SQL Server 中 RAISERROR 的用法详细介绍

    SQL Server 中 RAISERROR 的用法 raiserror 的作用: raiserror 是用于抛出一个错误.[ 以下资料来源于sql server 2005的帮助 ] 其语法如下: RAISERROR ( { msg_id | msg_str | @local_variable } { ,severity ,state } [ ,argument [ ,...n ] ] ) [ WITH option [ ,...n ] ] 简要说明一下: 第一个参数:{ msg_id | ms

  • 关于SQL Server中bit类型字段增删查改的一些事

    前言 本文主要给大家介绍了关于SQL Server中bit类型字段增删查改的一些事,话说BIT类型字段之前,先看"诡异"的一幕,执行Update成功,但是查询出来的结果依然是1,而不是Update的2 当别人问起我来的时候,本人当时也是处于懵逼状态的,后面联想具体的业务突然想起来这个字段是bit类型的 如果把这个现象跟BIT类型字段连续起来就不觉得奇怪了. 废话不多,直接上代码看结果就好了. 先建一个测试表 CREATE TABLE TestBIT ( Id INT IDENTITY(

随机推荐