1、集合运算

在数学中,不仅可以对指定的数字个体做四则运算,还可以对指定的集合整体做交并补运算。类似的,在数据库中也是不仅可以对具体的数据行进行增删改查,还可以对查询结果集进行集合运算。SQL Server 中的集合运算有并集运算、差集运算和交集运算三种,本节将逐一讲述。

1.1、并集运算 UNION

并集运算符 UNION 的作用是将两个或多个查询的结果集合并为单个结果集。在 UNION 运算中,需要确保各个子结果集的字段数相同、字段的顺序相同、字段的数据类型兼容。合并结果集的列名始终会取第一个子结果集中的列名,因此,如果要对合并结果集排序,则需要用第一个子结果集的字段名。

参数 ALL 表示将全部行并入结果集中,换句话说合并结果集可能会包含重复行;相反,如果未指定该参数,则会删除重复行。需要注意的是,在做重复判断时,UNION 会把两个 NULL 值被视为相等的。因为 UNION ALL 不需要删除重复行,所以性能比 UNION 要好。因此,除非必须要删除重复行,否则建议一律使用 UNION ALL。

1.1.1、简单 UNION ALL。查询 1 班的男生和 2 班的女生。示例如下:

SELECT * FROM T_Students t1 WHERE t1.ClassId = 1 AND t1.Gender = 1
UNION ALL
SELECT * FROM T_Students t2 WHERE t2.ClassId = 2 AND t2.Gender = 0;

1.1.2、简单 UNION ALL。查询 1 班的男生和该班的男生人数。示例如下:

SELECT 1 cnt,t1.Code,t1.Name FROM T_Students t1 WHERE t1.ClassId = 1 AND t1.Gender = 1
UNION ALL
SELECT COUNT(1),NULL,NULL FROM T_Students t2 WHERE t2.ClassId = 1 AND t2.Gender = 1;

查询结果如下:

cnt         Code                           Name
----------- ------------------------------ ------------------------------
1           S330102001                     郑强
1           S330102002                     肖俊生
1           S330300007                     钱波
1           S330104009                     金桥
4           NULL                           NULL

1.1.3、UNION 与 ORDER BY。查询 1 班的男生和 2 班的女生,并且将最终结果集按年龄从大到小排序。示例如下:

SELECT * FROM T_Students t1 WHERE t1.ClassId = 1 AND t1.Gender = 1
UNION ALL
SELECT * FROM T_Students t2 WHERE t2.ClassId = 2 AND t2.Gender = 0
ORDER BY t1.Birthday;

1.1.4、UNION 与 SELECT INTO。创建一个活动学生表,并将 1 班的男生和 2 班的女生加入其中。示例如下:

SELECT t1.Code,t1.Name,t1.Gender,t1.Birthday
INTO T_ActivityStudents
FROM T_Students t1
WHERE t1.ClassId = 1 AND t1.Gender=1
UNION ALL
SELECT t2.Code,t2.Name,t2.Gender,t2.Birthday
FROM T_Students t2
WHERE t2.ClassId = 2 AND t2.Gender=0;

1.1.5、通过括号来改变 UNION 的运算顺序。示例如下:

WITH t AS(
    SELECT TOP(3) * FROM T_Students t WHERE t.ClassId = 1 ORDER BY t.Birthday
)
SELECT * FROM t
UNION ALL(
    SELECT * FROM t
    UNION
    SELECT * FROM t
);

简单说明一下:首先,上例会返回 6 条数据。其次,很明显 CTE 中包含了年龄最大的 3 个学生。然后,括号会提升运算符的优先级,而且 UNION 会删除重复行,所以括号中会返回 3 条数据。最后,UNION ALL 不会删除重复行,所以最终返回的 6 条数据是第一个查询返回的 3 条数据加上括号中两个查询共同产生的 3 条数据。

1.2、差集运算 EXCEPT

差集运算符 EXCEPT 的作用是比较两个查询的结果集,然后返回左侧结果集包含但右侧结果集不包含的行,且不包含重复行。与 UNION 运算相同,EXCEPT 运算也要求各个子结果集的字段数相同、顺序相同、类型兼容。且 EXCEPT 也会把两个 NULL 值被视为相等的。示例如下:

SELECT * FROM T_GoodStudents t1 WHERE t1.Gender = 0
EXCEPT
SELECT * FROM T_GoodStudents t2 WHERE t2.Birthday < '2000-01-01';

注意:上例是用女生这个结果集减去非 00 后学生结果集,但得到的结果集并不一定是 00 后女生,因为女生的出生日期可能是 NULL,所以最终的结果集是 00 后女生加上出生日期为 NULL 的女生。

类似于 UNION:EXCEPT 也可以与 ORDER BY 连用来给差集(最终的结果集)排序,而且差集的列名也跟第一个子结果集的列名相同。EXCEPT 还可以与 SELECT INTO 连用将差集拷贝到一个新表中。当有多个 EXCEPT 时也可以通过括号来改变运算顺序。具体用法可参考 UNION 的示例。

1.3、交集运算 INTERSECT

交集运算符 INTERSECT 的作用是比较两个查询的结果集,然后返回左侧结果集和右侧结果集都包含的行,且不包含重复行。与 UNION 运算相同,INTERSECT 运算也要求各个子结果集的字段数相同、顺序相同、类型兼容。且 INTERSECT 也会把两个 NULL 值被视为相等的。示例如下:

SELECT * FROM T_GoodStudents t1 WHERE t1.Gender = 0
INTERSECT
SELECT * FROM T_GoodStudents t2 WHERE t2.Birthday < '2000-01-01';

注意:上例是取女生这个结果集和非 00 后学生结果集的交集,但得到的结果集并不一定是非 00 后女生,因为女生的出生日期可能是 NULL,所以最终的结果集是非 00 后女生加上出生日期为 NULL 的女生。

类似于 UNION:INTERSECT 也可以与 ORDER BY 连用来给交集(最终的结果集)排序,而且交集的列名也跟第一个子结果集的列名相同。INTERSECT 还可以与 SELECT INTO 连用将交集拷贝到一个新表中。当有多个 INTERSECT 时也可以通过括号来改变运算顺序。具体用法可参考 UNION 的示例。

1.4、集合运算小结

上文逐一讲述了各个集合运算符的语法和用途。其实这些集合运算符不仅可以单独使用,还可以结合起来使用,示例如下:

SELECT t1.Id,t1.Name,t1.Gender,t1.Birthday FROM T_Students t1 WHERE t1.ClassId = 1
UNION ALL
SELECT t2.Id,t2.Name,t2.Gender,t2.Birthday FROM T_Students t2 WHERE t2.ClassId = 3
EXCEPT
SELECT * FROM T_GoodStudents t3 WHERE t3.Birthday < '2000-01-01'
INTERSECT
SELECT * FROM T_GoodStudents t4 WHERE t4.Gender = 1;

注意:上例的运算顺序并不是先 UNION ALL,然后 EXCEPT,再 INTERSECT。因为 INTERSECT 比 EXCEPT 和 UNION 的优先级要高,而 EXCEPT 与 UNION 的优先级相同,所以上例的实际运算顺序是先 INTERSECT,然后 UNION ALL,最后再用 UNION ALL 的结果集减 INTERSECT 的结果集,即最后进行 EXCEPT 运算。

2、聚合函数

聚合函数的作用是对一组值执行计算,并返回单个结果值。聚合函数只能在 SELECT 子句或 HAVING 子句中作为表达式来用。求行数函数 COUNT、求和函数 SUM、求最大值函数 MAX、求最小值函数 MIN、求平均值函数 AVG,这 5 个函数是最常用的聚合函数,主流的关系型数据库也都支持它们。

其实常见的关系型数据库都支持很多聚合函数,但其中大部分都是非标准的,各个数据库之间的差别也比较大,而且这些函数也都不常用。个人建议实际工作中不要用这些函数,以免跟某个具体的数据库绑死。

2.1、求行数函数 COUNT

求行数函数 COUNT 会返回查询结果集的行数。COUNT 函数中可以是一个具体的列,也可以是代表所有列的星号,还可以是一个具体的常量或变量。示例如下:

SELECT COUNT(t.Id) result FROM T_Students t; -- result:32 rows
SELECT COUNT(*) result FROM T_Students t;    -- result:32 rows
SELECT COUNT(1) result FROM T_Students t;    -- result:32 rows

COUNT 是所有聚合函数中唯一不会忽略 NULL 值的函数,但如果被计算列本身含有 NULL 值是会被忽略的。示例如下:

SELECT COUNT(Remark) result FROM T_Students t; -- result:28 rows

在 COUNT 函数中添加 DISTINCT 参数,表示会先去除重复行,然后统计剩下的非 NULL 且唯一的值的个数。示例如下:

SELECT COUNT(DISTINCT Remark) result FROM T_Students t; -- result:26 rows

注意:COUNT 函数的返回值一定是大于或等于 0 的整数,证明如下:

SELECT COUNT(*) result;             -- result:1 rows
SELECT COUNT(*) result WHERE 1 = 2; -- result:0 rows

另外,从 SQL Server 2008 开始,官方在增加了一个COUNT_BIG函数,它的用法和用途与 COUNT 完全相同,唯一不同的就是返回值的类型。COUNT 函数总是返回一个 INT 类型的整数,而COUNT_BIG函数总是返回一个 BIGINT 类型的整数。示例如下:

SELECT COUNT_BIG(1) result FROM T_Students t;               -- result:32 rows
SELECT COUNT_BIG(Remark) result FROM T_Students t;          -- result:28 rows
SELECT COUNT_BIG(DISTINCT Remark) result FROM T_Students t; -- result:26 rows

2.2、求和函数 SUM

求和函数 SUM 会返回表达式中所有值的和。SUM 函数会忽略所有 NULL 值,且只能应用于数字类型的字段。例如要查询学生 1 第 1 次考试的总分,示例如下:

SELECT SUM(t.Scores) FROM T_ExamResults t WHERE t.StudentId = 1 AND t.Counts = 1;

在 SUM 函数中添加 DISTINCT 参数,表示会先去除重复行,然后统计剩下的非 NULL 且唯一的数值之和。示例如下:

SELECT SUM(t.Scores) result FROM T_ExamResults t WHERE t.StudentId = 6;          -- result:2202.5
SELECT SUM(DISTINCT t.Scores) result FROM T_ExamResults t WHERE t.StudentId = 6; -- result:1857.5

注意:SUM 函数的返回值有可能会是 NULL 值,证明如下:

SELECT SUM(1) result;             -- result:1
SELECT SUM(1) result WHERE 1 = 2; -- result:NULL

2.3、求最大值函数 MAX

求最大值函数 MAX 会返回表达式中的最大值。MAX 函数会忽略所有 NULL 值。例如要查询学生 1 课程 1 的历次考试最高分,示例如下:

SELECT MAX(t.Scores) FROM T_ExamResults t WHERE t.StudentId = 1 AND t.Counts = 1;

MAX 函数还可以作用于日期类型或字符类型,此时 MAX 将按照日期数值或字符排序顺序来确定最大值。示例如下:

SELECT MAX(t.Birthday) FROM T_Students t; -- 数值最大的出生日期,年龄最小
SELECT MAX(t.Name) FROM T_Students t;     -- 字符排序最靠后的姓名

注意:MAX 函数的返回值有可能会是 NULL 值,证明如下:

SELECT MAX(1) result;             -- result:1
SELECT MAX(1) result WHERE 1 = 2; -- result:NULL

2.4、求最小值函数 MIN

求最小值函数 MIN 会返回表达式中的最小值。MIN 函数会忽略所有 NULL 值。例如要查询学生 1 课程 1 的历次考试最低分,示例如下:

SELECT MIN(t.Scores) FROM T_ExamResults t WHERE t.StudentId = 1 AND t.Counts = 1;

MIN 函数还可以作用于日期类型或字符类型,此时 MAX 将按照日期数值或字符排序顺序来确定最小值。示例如下:

SELECT MIN(t.Birthday) FROM T_Students t; -- 数值最小的出生日期,年龄最大
SELECT MIN(t.Name) FROM T_Students t;     -- 字符排序最靠前的姓名

注意:MIN 函数的返回值有可能会是 NULL 值,证明如下:

SELECT MIN(1) result;             -- result:1
SELECT MIN(1) result WHERE 1 = 2; -- result:NULL

2.5、求平均值函数 AVG

求平均值函数 AVG 会返回表达式中所有值的平均值。AVG 函数会忽略所有 NULL 值,且只能应用于数字类型的字段。例如要查询学生 1 第 1 次考试的平均分,示例如下:

SELECT AVG(t.Scores) FROM T_ExamResults t WHERE t.StudentId = 1 AND t.Counts = 1;

在 AVG 函数中添加 DISTINCT 参数,表示会先去除重复行,然后统计剩下的非 NULL 且唯一的数值之和。示例如下:

SELECT AVG(t.Scores) result FROM T_ExamResults t WHERE t.StudentId = 6;          -- result:73.416666
SELECT AVG(DISTINCT t.Scores) result FROM T_ExamResults t WHERE t.StudentId = 6; -- result:74.300000

注意:AVG 函数的返回值有可能会是 NULL 值,证明如下:

SELECT AVG(1) result;             -- result:1
SELECT AVG(1) result WHERE 1 = 2; -- result:NULL

2.6、聚合函数小结

上文逐一讲述了常见五大聚合函数的基本语法和用途。其实这些聚合函数不仅可以单独使用,还可以结合起来使用。

示例一、查询第 1 次课程 2 考试成绩的统计结果:

SELECT COUNT(1) 参与人数,
    SUM(t.Scores) 总分,MAX(t.Scores) 最高分,MIN(t.Scores) 最低分,AVG(t.Scores) 平均分
FROM T_ExamResults t
WHERE t.Counts = 1 AND t.CourseId = 2;

示例二、查询 1 班的学生总数及年龄统计结果:

WITH t AS(
    SELECT t.Code,t.Name,DATEDIFF(YEAR,t.Birthday,GETDATE()) Age
    FROM T_Students t
    WHERE t.ClassId = 1
)
SELECT COUNT(1) 学生个数,MAX(t.Age) 最大年龄,MIN(t.Age) 最小年龄,AVG(t.Age) 平均年龄
FROM t;

注意:本文所有关于聚合函数的示例,查询选择列表中包含的都是聚合函数表达式,没有一个字段,因为不允许,不过倒是可以包含与表字段无关的常量或变量。其实聚合函数通常与 GROUP BY 子句一起使用,而且也只有包含在 GROUP BY 子句中的字段才能出现在查询选择列表中,具体原因将在下一篇博文中具体讲述。

3、本文小结

本文主要讲述了 SQL Server 中的集合运算和聚合函数,以及它们的基本语法和用途。在集合运算中,UNION 和 UNION ALL 是比较常用的。而常见的 5 个聚合函数都比较常用。

本文参考链接:

本文链接http://www.cnblogs.com/hanzongze/p/tsql-aggregate.html
版权声明:本文为博客园博主 韩宗泽 原创,作者保留署名权!欢迎通过转载、演绎或其它传播方式来使用本文,但必须在明显位置给出作者署名和本文链接!个人博客,能力有限,若有不当之处,敬请批评指正,谢谢!

SQL Server温故系列(4):SQL 查询之集合运算 & 聚合函数的更多相关文章

  1. SQL Server温故系列(5):SQL 查询之分组查询 GROUP BY

    1.GROUP BY 与聚合函数 2.GROUP BY 与 HAVING 3.GROUP BY 扩展分组 3.1.GROUP BY ROLLUP 3.2.GROUP BY CUBE 3.3.GROUP ...

  2. SQL Server温故系列(2):SQL 数据操作 CRUD 之简单查询

    1.查询语句 SELECT 1.1.查询语句的 SELECT 子句 1.2.查询语句的 FROM 子句 1.2.1.内连接查询 INNER JOIN 1.2.2.外连接查询 OUTER JOIN 1. ...

  3. SQL Server温故系列(3):SQL 子查询 &amp; 公用表表达式 CTE

    1.子查询 Subqueries 1.1.单行子查询 1.2.多行子查询 1.3.相关子查询 1.4.嵌套子查询 1.5.子查询小结及性能问题 2.公用表表达式 CTE 2.1.普通公用表表达式 2. ...

  4. SQL Server温故系列(1):SQL 数据操作 CRUD 之增删改合

    1.插入语句 INSERT INTO 1.1.用 INSERT 插入单行数据 1.2.用 INSERT 插入多行数据 1.3.用 INSERT 插入子查询结果行 1.4.INSERT 小结及特殊字段插 ...

  5. SQL Server调优系列进阶篇 - 查询语句运行几个指标值监测

    前言 上一篇我们分析了查询优化器的工作方式,其中包括:查询优化器的详细运行步骤.筛选条件分析.索引项优化等信息. 本篇我们分析在我们运行的过程中几个关键指标值的检测. 通过这些指标值来分析语句的运行问 ...

  6. SQL Server 调优系列进阶篇 - 查询语句运行几个指标值监测

    前言 上一篇我们分析了查询优化器的工作方式,其中包括:查询优化器的详细运行步骤.筛选条件分析.索引项优化等信息. 本篇我们分析在我们运行的过程中几个关键指标值的检测. 通过这些指标值来分析语句的运行问 ...

  7. SQL SERVER 2012 第三章 T-SQL 基本语句 group by 聚合函数

    select Name,salesPersonID From Sales.store where name between 'g' and 'j' and salespersonID > 283 ...

  8. SQL Server调优系列基础篇(子查询运算总结)

    前言 前面我们的几篇文章介绍了一系列关于运算符的介绍,以及各个运算符的优化方式和技巧.其中涵盖:查看执行计划的方式.几种数据集常用的连接方式.联合运算符方式.并行运算符等一系列的我们常见的运算符.有兴 ...

  9. SQL Server调优系列进阶篇(查询语句运行几个指标值监测)

    前言 上一篇我们分析了查询优化器的工作方式,其中包括:查询优化器的详细运行步骤.筛选条件分析.索引项优化等信息. 本篇我们分析在我们运行的过程中几个关键指标值的检测. 通过这些指标值来分析语句的运行问 ...

随机推荐

  1. 使用IPostBackEventHandler让JavaScript“调用”回传事件

    在由ASP.NET所谓前台调用后台.后台调用前台想到HTTP——实践篇(二)通过自己模拟HTML标签事件与服务器交互,讲了ASP.NET的服务器控件是怎么render成HTML后市怎么“调用”后台方法 ...

  2. css3常用标签

    30个最常用css选择器解析   你也许已经掌握了id.class.后台选择器这些基本的css选择器.但这远远不是css的全部.下面向大家系统的解析css中30个最常用的选择器,包括我们最头痛的浏览器 ...

  3. LeetCode Potential Thought Pitfalls

    Problem Reason Reference Moving ZeroesSort Colors Corner cases   Shortest Word Distance Thought: 2 p ...

  4. 分享15款为jQuery Mobile定制的插件

    jQuery Mobile 1.0 已经发布了, 做为jQuery的移动设备类库, 并且依靠着jQuery这个及其受欢迎的类库,必将带给大家不一样的使用体验,基于jQuery Mobile的插件开发必 ...

  5. Python 3.4 链接mysql5.7 数据库使用方法

    最近笔者在研究Python3.4链接MySQL5.7版本,笔者意图在网上找到一个比较好的链接方式,网上介绍的大致有 mysqldb或者pymssql这两种方法来链接,mysqldb下载地址http:/ ...

  6. TI的AM3359的sd卡分区以及sd卡启动说明

    [1]sd 卡分区: ti提供了自己的分区shell脚本create-sdcard.sh  脚本目录在:ti-sdk-am335x-evm-05.06.00.00/bin/ (1)插入sd卡(若是笔记 ...

  7. JSON和JSONP区别

    JSON(JavaScript Object Notation)和JSONP(JSON with Padding) JSON是一种数据交换格式,JSONP是一种跨域数据交互协议 JSONP利用scri ...

  8. leetcode_question_85 Largest Rectangle in Histogram

    Given n non-negative integers representing the histogram's bar height where the width of each bar is ...

  9. git编译安装与常见问题解决

    1. 先去官网下载一个安装包 ,假设目录/APP/ido   2. cd /APP/ido   3. tar -zxvf git-2.7.2.tar.gz   4. 安装依赖 yum -y insta ...

  10. “宇宙最强” IDE,Visual Studio 2019 正式发布

    转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 本文由葡萄城翻译并发布 今天凌晨Visual Studio 2019已经正式发布,现在已经可以下载了.使用V ...