Mysql 8 新特性 window functions 的作用

MySQL 8.0的新特性包括:

  • 对Unicode 9.0的开箱即用的完整支持
  • 支持窗口函数和递归SQL语法,这在以往是不可能或者很难才能编写这样的查询语句
  • 对原生JSON数据和文档存储功能的增强支持
  • MySQL 8.0的发布,跳过了多个版本号(从5.5开始),由于6.0修改和7.0是用来保留做MySQL的集群版本,因此采用了8.0的版本号。

1. 问题

Mysql 8.0.2 中新增加了一个主要功能 - 窗口函数 window function

这个功能具体是解决什么问题?下面先看一个SQL查询的场景,看一下平时我们是怎么做的,然后再看一下如何使用窗口函数来更方便的解决

(1)准备测试表和数据

建一个简单的电影信息表,字段有:

ID
release_year(发行年份)
category_id(所属分类ID)
rating(评分)
CREATE TABLE films (
 id int(11),
 release_year int(11),
 category_id int(11),
 rating decimal(3,2)
)

插入测试数据

insert into films2 values
(1,2015,1,8.00),
(2,2015,2,8.50),
(3,2015,3,9.00),
(4,2016,2,8.20),
(5,2016,1,8.40),
(6,2017,2,7.00);

整体形式如下

(2)查询需求

查询每一年中的平均评分,要求每条记录后面都显示当年的平均评分

例如 2015 年,有3条记录,8.00, 8.50, 9.00 的平均分是 8.5,2016年有2条记录,平均分是 8.3,2017年有1条记录,平均分为 7.00

最终结果的形式如下:

我们可以使用子查询来计算各年的平均分,然后使用 join 把结果连接回去

SELECT
 f.id, f.release_year,
 f.rating, years.year_avg
FROM films f
LEFT JOIN (
 SELECT f.release_year,
  AVG(rating) AS year_avg
 FROM films f
 GROUP BY f.release_year
) years
ON f.release_year = years.release_year

是不是有点复杂,下面看下窗口函数的处理方式

2. window functions 的解决方案

什么是 window functions

window functions 是对一组数据进行计算,与使用 group by 时不同,不会进行单行的结果输出,而是与每条记录相关联

语法示例:

SELECT
function_name OVER ( window_definition )
FROM (...)

window_definition 是定义要计算的记录集合,就像是一个小窗口,在整体数据集合上显示出一部分

function_name 指定了对于窗口中的数据集合执行什么计算

回头看下上面的那个查询,需要计算每部电影所在年份的所有电影平均评分,下面使用窗口函数来处理

SELECT
 f.id, f.release_year,
 f.category_id, f.rating,
 AVG(rating) OVER
 (PARTITION BY release_year) AS year_avg
FROM films f

window_definition 部分使用了 PARTITION BY 从句,它告诉数据库把结果数据集合分割成更小的部分,把 release_year 相同的放在一起,函数 AVG(rating) 会对每个窗口数据进行计算,然后把结果放到每一行中

查询示例1

计算每部电影在所属年份中的评分排行位置

查询语句

SELECT
 f.id, f.release_year,
 f.category_id, f.rating,
 RANK() OVER (PARTITION BY release_year
  ORDER BY rating DESC) AS year_rank
FROM films f

window_definition 部分使用 PARTITION BY 来根据 release_year 划分窗口,使用 ORDER BY 在窗口内排序

RANK() 函数可以返回一行数据在本窗口中的位置

查询结果

查询示例2

查看每部电影在总排行榜中的位置

查询语句

SELECT
 f.id, f.release_year,
 f.category_id, f.rating,
 RANK() OVER (ORDER BY rating DESC)
  AS general_rank
FROM films f order by id

主语句中的 order by 保证了整个数据集的排序

window_definition 中没有使用 PARTITION BY,那么就是把整个结果集合当做一个窗口,ORDER BY 对窗口中的数据根据 rating 做降序排序,把得分最高的放前面

RANK() 函数取得每条记录在窗口中的位置

查询结果

3. 小结

窗口函数是 Mysql 8.0.2 中的高级特性,可以方便的执行聚合计算,而不用对结果集进行实际的聚合,大大增加了灵活性、可读性,更便于维护

(0)

相关推荐

  • Mysql 8 新特性 window functions 的作用

    MySQL 8.0的新特性包括: 对Unicode 9.0的开箱即用的完整支持 支持窗口函数和递归SQL语法,这在以往是不可能或者很难才能编写这样的查询语句 对原生JSON数据和文档存储功能的增强支持 MySQL 8.0的发布,跳过了多个版本号(从5.5开始),由于6.0修改和7.0是用来保留做MySQL的集群版本,因此采用了8.0的版本号. 1. 问题 Mysql 8.0.2 中新增加了一个主要功能 - 窗口函数 window function 这个功能具体是解决什么问题?下面先看一个SQL查

  • MySQL 8 新特性之Invisible Indexes

    背景 索引是把双刃剑,在提升查询速度的同时会减慢DML的操作.毕竟,索引的维护需要一定的成本.所以,对于索引,要加上该加的,删除无用的.前者是加法,后者是减法.但在实际工作中,大家似乎更热衷于前者,而很少进行后者.究其原因,在于后者,难.难的不是操作本身,而是如何确认一个索引是无用的. 如何确认无用索引 在不可见索引出现之前,大家可以通过sys.schema_unused_indexes来确定无用索引.在MySQL 5.6中,即使没有sys库,也可通过该视图的基表来进行查询. mysql> sh

  • Java8新特性之lambda的作用_动力节点Java学院整理

    我们期待了很久lambda为java带来闭包的概念,但是如果我们不在集合中使用它的话,就损失了很大价值.现有接口迁移成为lambda风格的问题已经通过default methods解决了,在这篇文章将深入解析Java集合里面的批量数据操作(bulk operation),解开lambda最强作用的神秘面纱. 1.关于JSR335 JSR是Java Specification Requests的缩写,意思是Java 规范请求,Java 8 版本的主要改进是 Lambda 项目(JSR 335),其

  • MySQL 8.0的关系数据库新特性详解

    前言 MySQL 8.0 当前的最新版本是 8.0.4 rc,估计正式版本出来也快了.本文介绍几个 8.0 在关系数据库方面的主要新特性. 你可能已经知道 MySQL 从版本 5.7 开始提供了 NoSQL 存储的功能,在 8.0 中这部分功能也得到了一些改进,但鉴于这个在实际当中用得极少,本人也是没用过,所以本文不会介绍这方面的东西,而是关注其关系数据库方面. 1.隐藏索引 隐藏索引的特性对于性能调试非常有用.在 8.0 中,索引可以被"隐藏"和"显示".当一个索

  • Java8新特性之重复注解与类型注解详解

    目录 Java8新特性重复注解与类型注解 一.JDK5中的注解 1.注解(@) 2.作用 3.如何理解注解? 4.关于注解 5.注解分为三个阶段 6.注解的属性类型 7.为注解增加属性 二.Java8中的注解 1.类型注解 2.重复注解 三.Java8对注解的增强 Java8新特性重复注解与类型注解 在Java8之前,在某个类或者方法,字段或者参数上标注注解时,同一个注解只能标注一次.但是在Java8中,新增了重复注解和类型注解,也就是说,从Java8开始,支持在某个类或者方法,字段或者参数上标

  • MySQL 5.7新特性介绍

    1. 介绍 身处MySQL这个圈子,能够切身地感受到大家对MySQL 5.7的期待和热情,似乎每个人都迫不及待的想要了解.学习和使用MySQL 5.7.那么,我们不禁要问,MySQL 5.7到底做了哪些改进,引入了哪些新功能,性能又提升了多少,能够让大家翘首以盼,甚至欢呼雀跃呢? 下面就跟随我来一起了解一下MySQL 5.7的部分新功能.想要在一篇文章中介绍完MySQL 5.7的所有改进,几乎是不可能的.所以,我会选择一些有特别意思的.特别有用的功能进行介绍.希望通过这篇文章,能够激发大家对My

  • MySQL 5.6 GTID新特性实践

    GTID简介 什么是GTID GTID(Global Transaction ID)是对于一个已提交事务的编号,并且是一个全局唯一的编号. GTID实际上是由UUID+TID组成的.其中UUID是一个MySQL实例的唯一标识.TID代表了该实例上已经提交的事务数量,并且随着事务提交单调递增.下面是一个GTID的具体形式 3E11FA47-71CA-11E1-9E33-C80AA9429562:23 更详细的介绍可以参见:官方文档 GTID的作用 那么GTID功能的目的是什么呢?具体归纳主要有以下

  • MySQL 8.0 新特性之哈希连接(Hash Join)

    MySQL 开发组于 2019 年 10 月 14 日 正式发布了 MySQL 8.0.18 GA 版本,带来了一些新特性和增强功能.其中最引人注目的莫过于多表连接查询支持 hash join 方式了.我们先来看看官方的描述: MySQL 实现了用于内连接查询的 hash join 方式.例如,从 MySQL 8.0.18 开始以下查询可以使用 hash join 进行连接查询: SELECT * FROM t1 JOIN t2 ON t1.c1=t2.c1; Hash join 不需要索引的支

  • MySQL 8.0 新特性之检查约束的实现

    大家好,我是只谈技术不剪发的 Tony 老师.这次我们来介绍一个 MySQL 8.0 增加的新功能:检查约束(CHECK ). SQL 中的检查约束属于完整性约束的一种,可以用于约束表中的某个字段或者一些字段必须满足某个条件.例如用户名必须大写.余额不能小于零等. 我们常见的数据库都实现了检查约束,例如 Oracle.SQL Server.PostgreSQL 以及 SQLite:然而 MySQL 一直以来没有真正实现该功能,直到最新的 MySQL 8.0.16. MySQL 8.0.15 之前

  • MySQL 8.0新特性之隐藏字段的深入讲解

    前言 MySQL 8.0.23 版本增加了一个新的功能:隐藏字段(Invisible Column),也称为不可见字段.本文给大家介绍一下 MySQL 隐藏字段的相关概念和具体实现. 基本概念 隐藏字段需要在查询中进行显式引用,否则对查询而言是不可见的.MySQL 8.0.23 开始支持隐藏字段,在此之前所有的字段都是可见字段. 考虑以下应用场景,假如一个应用程序使用SELECT *语句访问某个表,并且必需持续不断地进行查询,即使我们为该表增加了一个该应用不需要的新字段时也要求能够正常工作.对于

随机推荐