SQL Server数据汇总五招轻松搞定

本文我们将讨论如何使用GROUPBY子句来汇总数据。

使用单独列分组

GROUP BY子句通过设置分组条件来汇总数据,在第一个例子中,我在数据库AdventureWork2012中的表 Sales.SalesOrderDetail.中的一列上进行数据分组操作。这个例子以及其他例子都使用数据库AdventureWorks2012,如果你想使用它运行我的代码,你可以点击下载。

下面是第一个示例的源码,在CarrierTrackingNumber列上使用group by子句进行数据分组操作

USE AdventureWorks2012; 

GO 

SELECT CarrierTrackingNumber 

,SUM(LineTotal) AS SummarizedLineTotal 

FROM AdventureWorks2012.Sales.SalesOrderDetail 

GROUP BY CarrierTrackingNumber;

在我运行这段代码后,会得到3807个记录,下面是这个庞大的结果集中前五个数值:

CarrierTrackingNumber LineTotal 

-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 

6E46-440A-B5 2133.170700 

B501-448E-96 4085.409800 

8551-4CDF-A1 72616.524200 

B65C-4867-86 714.704300 

99CE-4ADA-B1 16185.429200

在上面的示例中,我使用group by子句选择哪些列作为聚集dventureWorks2012.Sales.SalesOrderDetai数据表数据的条件,在例子中,我使用CarrierTrackingNumber汇总数据,当你进行数据分组时,只有在group By 子句中出现的列才在selection 列表中有效。在我的示例中,我使用聚集函数SUM计算LineTotal,为了使用方便,我为它设置了别名SummarizedLineTotal。

如果我想获得CarrierTrackingNumber 满足特定条件下的聚集集合,那我可以在Where子句中对查询进行限制,就像我下面做的这样:

USE AdventureWorks2012; 

GO 

SELECT CarrierTrackingNumber 

,SUM(LineTotal) AS SummarizedLineTotal 

FROM AdventureWorks2012.Sales.SalesOrderDetail 

WHERE CarrierTrackingNumber = '48F2-4141-9A' 

GROUP BY CarrierTrackingNumber;

这里我在原始查询基础上在where子句中加上了一条限制,我设置了我的查询只返回CarrierTrackingNumber 等于一个特定值的结果。运行这段代码后,我会得到记录中CarrierTrackingNumber 等于48F2-4141-9A的行的数量。Where子句的过滤行为在数据被聚集之前就已生效。

通过多列来分组

有时候你可能需要使用多列来进行数据分组,下面是我使用多列进行分组的示例代码

SELECT D.ProductID 

, H.OrderDate 

, SUM(LineTotal) AS SummarizedLineTotal 

FROM AdventureWorks2012.Sales.SalesOrderDetail D 

JOIN AdventureWorks2012.Sales.SalesOrderHeader H 

ON D.SalesOrderId = H.SalesOrderID 

GROUP BY ProductID, OrderDate;

查询返回26878行数据,这是上面查询返回的部分结果:

ProductID OrderDate LineTotal 

-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 

714 2008-05-21 00:00:00.000 99.980000 

859 2007-11-03 00:00:00.000 48.980000 

923 2007-11-23 00:00:00.000 14.970000 

712 2007-12-22 00:00:00.000 62.930000 

795 2007-10-14 00:00:00.000 2443.350000 

950 2007-07-01 00:00:00.000 2462.304000 

795 2007-11-06 00:00:00.000 2443.350000 

877 2007-11-19 00:00:00.000 15.900000 

713 2007-10-01 00:00:00.000 99.980000 

860 2008-05-31 00:00:00.000 48.980000 

961 2008-05-01 00:00:00.000 36242.120880

在上面的示例程序中,Group by 子句中用到了ProductID列与OrderDate列,SQL Server基于ProductID和OrderDate二者组合的唯一性,返回LineTotal的值,并为其设置别名SummarizedLineTotal。如果你查看程序的输出,你会发现SQL Server 对数据进行分组后,返回的结果并没有特定的顺序,如果你需要返回结果按照一定顺序排序,你需要使用ORDER BY 子句,就像我在下面代码中展示的那样。

SELECT D.ProductID 

, H.OrderDate 

, SUM(LineTotal) AS SummarizedLineTotal 

FROM AdventureWorks2012.Sales.SalesOrderDetail D 

JOIN AdventureWorks2012.Sales.SalesOrderHeader H 

ON D.SalesOrderId = H.SalesOrderID 

GROUP BY ProductID, OrderDate 

ORDER BY SummarizedLineTotal DESC;

在上面的代码中,我按照SummorizedLineTotal降序对结果集进行排序,此列的值通过Group BY子句分组后对LineTotal使用聚合函数Sum得到。我对结果按照SummorizedLineTotal 的值降序排列。如果你运行此程序,你可以得出LineTotal 数量最高的ProductID和OrderDate。

对没有任何值的数据进行分组

有时候你会需要对一些记录中包含空值的数据进行分组操作。当你在SQL Server 执行此类操作时,它会自动假设所有NULL值相等。让我看一下下面的示例程序

CREATE TABLE NullGroupBy (OrderDate date, Amount Int); 

INSERT INTO NullGroupBy values (NULL,100), 

('10-30-2014',100), 

('10-31-2014',100), 

(NULL,100); 

SELECT OrderDate, SUM(Amount) as TotalAmount 

FROM NullGroupBy 

GROUP BY OrderDate; 

DROP TABLE NullGroupBy; 

When I run this code I get the following output: 

OrderDate TotalAmount 

-- -- -- -- -- -- -- -- -- -- - 

NULL 200 

2014-10-30 100 

2014-10-31 100

在上面的程序中,我首先创建并填充了一个NullGroupBy表.在这个表中,我放置了四个不同的行,第一行和最后一行的orderDate列值为NULL,其他两列的orderDate值不同。从上面的输出结果可以看到,SQL Server 在分组时将OrderDate为NULL的两行聚集为一行处理。

在Group BY 子句中使用表达式

有时你需要在Group by子句中使用表达式,而不是具体的列。SQL Server允许你在Group By子句中指定一个表达式,就像下面的代码中所示:

SELECT CONVERT(CHAR(7),H.OrderDate,120) AS [YYYY-MM] 

, SUM(LineTotal) AS SummarizedLineTotal 

FROM AdventureWorks2012.Sales.SalesOrderDetail D 

JOIN AdventureWorks2012.Sales.SalesOrderHeader H 

ON D.SalesOrderId = H.SalesOrderID 

GROUP BY CONVERT(CHAR(7),H.OrderDate,120) 

ORDER BY SummarizedLineTotal DESC;

上述代码使用OrderDate 列中的年月数据进行分组,通过使用表达式CONVERT(CHAR(7),H.OrderDate,120) ,我告诉SQL服务器截取OrderDate ODBC标准日期格式的前七个字符,也就是OrderDate yyyy-mm部分。基于这个表达式,我可以找出特定年月的total SummarizeLineTotal值,在Group By子句中使用表达式,以及对LineTotal值排序,我可以找出哪一年哪一个月的SummarizeLineTotal最大或最小。

使用HAVING子句过滤数据

Having 是另外一个能与Group BY 子句结合使用的重要子句,使用Having 子句,你可以过滤掉不符合Having子句所接表达式的数据行,当我在其上使用where子句时,在聚集之前就会产生过滤行为。Having 子句允许你基于某些标准过滤聚合行。想要更清楚地了解Having子句,请参考下面代码:

SELECT D.ProductID 

, H.OrderDate 

, SUM(LineTotal) AS SummarizedLineTotal 

FROM AdventureWorks2012.Sales.SalesOrderDetail D 

JOIN AdventureWorks2012.Sales.SalesOrderHeader H 

ON D.SalesOrderId = H.SalesOrderID 

GROUP BY ProductID, OrderDate 

HAVING SUM(LineTotal) > 200000 

ORDER BY SummarizedLineTotal DESC;

在上面的代码中Having子句限制条件是SUM(LineTotal) > 200000。这个having子句保证最终结果中LineTotal的聚合值(SummarizedLineTotal)大于200000.通过使用having子句,我的查询只返回一行数据,其SummarizedLineTotal大于200000.having子句允许SQL Server 只返回聚合结果满足Having子句限制的条件的数据行。

总结

许多应用要求数据在展示之前要经过一定的汇总操作,GROUP BY子句就是SQL Server提供的汇总数据的机制。GROUPBY子句允许你使用HAVING子句对汇总数据进行特定的过滤。希望下次你需要汇总一些数据的时候,你可以更加容易的达到目的。

(0)

相关推荐

  • SQL Server优化50法汇总

    查询速度慢的原因很多,常见如下几种:1.没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷)2.I/O吞吐量小,形成了瓶颈效应.3.没有创建计算列导致查询不优化.4.内存不足5.网络速度慢6.查询出的数据量过大(可以采用多次查询,其他的方法降低数据量)7.锁或者死锁(这也是查询慢最常见的问题,是程序设计的缺陷)8.sp_lock, sp_who, 活动的用户查看,原因是读写竞争资源.9.返回了不必要的行和列 10.查询语句不好,没有优化可以通过如下方法来优化查询 :1.把数据.日

  • SQLServer 数据库的数据汇总完全解析(WITH ROLLUP)

    现有表A,内容如下: 编码 仓库 数量 01 A 6 01 B 7 02 A 8 02 B 9 现在想按编码查询出这种格式: 01 A 6 01 B 7 汇总小计: 13 02 A 8 02 B 9 汇总小计: 17 问:该如何实现? 乍一看,好像很容易,用group by好像能实现?但仔细研究下去,你又会觉得group by也是无能为力,总欠缺点什么,无从下手.那么,到底该如何做呢?别急,SQL Server早就帮我们做好了,下面,跟我来. 首先,让我们来看一段话: 在生成包含小计和合计的报表

  • SQLServer中汇总功能的使用GROUPING,ROLLUP和CUBE

    第一次看到这样的SQL语句,看不懂,其中用到了下面的不常用的 聚集函数:GROUPING 用于汇总数据用的运算符: ROLLUP SELECT CASE GROUPING(o.customerid) WHEN 0 THEN o.customerid ELSE  '(Total)' END AS AllCustomersSummary, CASE GROUPING(od.orderid) WHEN 0 THEN od.orderid ELSE -1 END AS IndividualCustome

  • SQL Server页类型汇总+疑问汇总

    SQL Server中包含多种不同类型的页,来满足数据存储的需求.不管是什么类型的页,它们的存储结构都是相同的.每个数据文件都包含相当数量的由8KB组成的页,即每页有8192bytes可用,每页都有96byte用于页头的存储,剩下的空间 才用来存储实际的数据,在页的最后是数据行偏移数组,也可以叫"页槽"数组,我们可以把一个页看做是有一个个方格的书橱,哪行数据占用了哪个槽,都在页尾的位置进行标示,并且页尾数组的写入顺序是倒叙的,这样就可以有效的利用页空间. 由此可以预见,页面上的&quo

  • SQLServer与Oracle常用函数实例对比汇总

    一.数学函数 1.绝对值 复制代码 代码如下: S:select abs(-1) value O:select abs(-1) value from dual 2.取整(大) 复制代码 代码如下: S:select ceiling(-1.001) value O:select ceil(-1.001) value from dual 3.取整(小) 复制代码 代码如下: S:select floor(-1.001) value O:select floor(-1.001) value from

  • SQL Server数据汇总五招轻松搞定

    本文我们将讨论如何使用GROUPBY子句来汇总数据. 使用单独列分组 GROUP BY子句通过设置分组条件来汇总数据,在第一个例子中,我在数据库AdventureWork2012中的表 Sales.SalesOrderDetail.中的一列上进行数据分组操作.这个例子以及其他例子都使用数据库AdventureWorks2012,如果你想使用它运行我的代码,你可以点击下载. 下面是第一个示例的源码,在CarrierTrackingNumber列上使用group by子句进行数据分组操作 USE A

  • 浅谈基于SQL Server分页存储过程五种方法及性能比较

    在SQL Server数据库操作中,我们常常会用到存储过程对实现对查询的数据的分页处理,以方便浏览者的浏览. 创建数据库data_Test : create database data_Test GO use data_Test GO create table tb_TestTable --创建表 ( id int identity(1,1) primary key, userName nvarchar(20) not null, userPWD nvarchar(20) not null, u

  • SQL Server数据迁移至PostgreSQL出错的解释以及解决方案

    问题重现: 1.PG客户端: postgres=# create table text_test (id int,info text); CREATE TABLE postgres=# insert into text_test values (1,E'\0x00'); ERROR: invalid byte sequence for encoding "UTF8": 0x00 2.SQL Server产生数据 create table test_varchar(id int,name

  • SQL Server数据复制到的Access两步走

    我们今天主要向大家讲述的是把SQL Server数据复制到的Access数据库中的实际操作步骤,把SQL Server数据库中的某些数据复制到的Access数据库中,其表的主要结构是相同的,不要提用openrowset,因为Access文件和SQL Server不在一台机器上. 初步的想法是用两个recordset,一个从SQL取数据,一个往Access里面插入数据 因为表的字段比较多,所以只好用一个循环 while (!m_pRecordset_sql->adoEOF) { m_pRecord

  • SQL Server数据表字段自定义自增数据格式的方法

    本文实例讲述了SQL Server数据表字段自定义自增数据格式的方法.分享给大家供大家参考,具体如下: --修改数据表SYS_Company中字段CompanyId自定义自增约束 ALTER TABLE [dbo].[SYS_Company] Add Constraint DF_SYS_Company_CompanyId DEFAULT ([dbo].[f_PrimaryCode_SYS_Company]()) FOR [CompanyId] --Go --删除约束 Alter table SY

  • Sql Server数据把列根据指定内容拆分数据的方法实例

    今天由于工作需要,需要把数据把列根据指定的内容拆分数据 其中一条数据实例 select id , XXXX FROM BIZ_PAPER where  id ='4af210ec675927fa016772bf7dd025b0' 拆分方法: select t3.id ,t3.XXXX as XXXX from ( select A.id , B.XXXX from ( SELECT id, XXXX = CONVERT(xml,'<root><v>' + REPLACE(XXXX

  • 通过Python实现对SQL Server 数据文件大小的监控告警功能

    1.需求背景 系统程序突然报错,报错信息如下: The transaction log for database '@dbname' is full. To find out why space in the log cannot be reused, see the log_reuse_wait_desc column in sys.databases 此时查看log文件,已达2T. 当时的紧急处理方案是,移除掉镜像,修改数据库恢复模式(由full修改为simple),收缩日志. 为了防止类似

  • Navicat连接SQL Server数据:报错08001-命名管道提供程序的完美解决方法

    新安装了SQL server用Navicat进行连接时出现下面的问题 首先用SQL server自带的GUI用windows认证的方式进入,重新配置了登录名和登录密码分别为CDSS和CDSS,之后直接采用此登录名和登录密码发现还是连不上,后来的解决办法是,把服务重新启动一下. 修改配置登录名后需要重启一下服务?好像有那么点道理,注意是重启服务而不仅仅是重启GUI. mark一下服务列表的打开路径:开始→控制面板→系统和安全→管理工具→服务 还有一个是SQL server配置管理器,打开网络配置,

  • SQL Server数据表压缩

    概述 SQL Server的主要性能取决于磁盘I/O效率,SQL Server .2008提供了数据压缩功能来提高磁盘I/O效率.表压缩意味着减小数据的磁盘占有量,所以压缩可以用在堆表.聚集索引的表.非聚集索引的表.索引视图.分区表上. 可压缩的数据类型 smallint.int.Bigint.decimal.numeric.real.float.money.smallmoeny.bit.datetime.datetime2.datetimeoffset.char.nchar.binary.ro

  • SQL Server 数据文件收缩和查看收缩进度的步骤

    目录 回收步骤: 1.查看日志文件大小[一般回收比较大的] 2.查看日志文件空间是否可回收[只有log_reuse_wait_desc是NOTHING状态才可回收] 3.回收日志文件空间 4.查看数据文件大小 5.收缩数据文件[按照经验,最好每5G循环收缩,如果影响业务,随时中断,不会回滚] 6.查看收缩进度[预估值] SQL Server在删除数据后,会重新利用这部分空间,所以如果不是空间紧张的情况下,可以不回收. 回收一般先回收日志文件,因为这个回收速度非常快,可以短时间内清理出一部分可用空

随机推荐