MongoDB 聚合查询详解

2026-05-09 00:33:12

聚合管道

聚合框架是 MongoDB 中的一组分析工具，可以对一个或多个集合中的文档进行分析。

MongoDB 的聚合框架基于管道的概念：首先从集合中获取到输入，然后将输入的文档传递到一个或多个阶段，每个阶段都将之前阶段输出的内容作为输入，最终得到一个聚合结果作为输出。

上面的图是一个比较宽泛的管道流程图。这里展示一个 MongoDB 聚合语句映射到管道之后的情况：

在这里可以看得出，aggregate([{}, {}]) 是一个聚合语句，在函数的数组中，每一个对象都是一个阶段，$match 应该就是一个筛选文档的阶段，$group 应该就是一个分组汇总的阶段。

管道阶段

使用聚合框架最重要的就是熟悉操作的语法，以及将这些语法构建成管道当中的阶段。

在 MongoDB 聚合框架中，每一个阶段都必须要规定一个特定的阶段运算符，这些阶段运算符表明了阶段的执行规则，可以到官方文档上查看更多、更详细的内容。

常见操作

最常见的操作应该是能与普通查询语句对应上的操作，如查询、投影、排序、跳过、限制等等。虽然这些在一个 find() 语句中就能实现。

最常使用的操作就是查询，也可以说是筛选、过滤，在聚合框架中使用 $match 来表明这是一个筛选文档的阶段。如下是其使用语法：

{ $match: { <query> } }

第二个则是投影，这个阶段可以修改输入文档的结构，通常是重命名、增加、删除属性，也可以通过表达式创建计算结果以及嵌套文档。如下是其使用语法：

// <field>: <1 or true>
// <field>: <0 or false>
// <field>: <expression>
{ $project: { <specification(s)> } }

排序、跳过、限制都比较容易理解，实际上可以与 find() 结果的游标支持的函数做联系。如下是其使用语法：

// 排序
{ $sort: { <field1>: <sort order>, <field2>: <sort order> ... } }
// 跳过
{ $skip: <positive 64-bit integer> }
// 限制
{ $limit: <positive 64-bit integer> }

上述 5 个阶段是最常用的阶段，在使用时需要注重它们的效率，一般会使用这样的顺序去构建管道：

通过筛选语句过滤指定集合，得到符合要求的文档列表；
如果排序非常重要，这一个阶段需要在过滤文档之后；
如果需要做分页功能，应该是先执行跳过的阶段，然后再到限制的阶段；
最后，执行投影阶段（进入投影阶段的文档应该尽量少）。

条件组累加器

在一些阶段操作中，MongoDB 支持使用累加器来增强聚合功能，这里说的累加器泛指求和、平均值、最大值、最小值等功能的操作符。

算术运算

这里的算术运算不是统称的四则运算，指的是与数学相关的运算，如平均值、求和等。

$avg 累加器用于计算平均值，通过是直接指定一个键名即可，使用 { $avg: "$keyName" } 这样的语法。

$sum 累加器用于计算指定键的和，也是直接指定一个键名即可，使用 { $sum: "$keyName" } 这样的语法。

最值运算

累加器支持的最值包括这些：最小值、最大值、最大的 n 个值。

最小值和最大值的理解都比较容易，使用也比较容易。最小值使用了 { $min: "$keyName" } 这样的语法，最大值使用了 { $max: "$keyName" } 这样的语法。

最大的 n 个值是在 5.2 版本新增的累加器，其作用是通过指定输入的键，得到这些键值中排序后最大的 n 个值，其语法如下：

{
    $maxN: {
        // 指定键名  input: "$score"
        input: <expression>,
        // 指定数量  n: 3
        n: <expression>
    }
}

数组提取

这里的数组提取指的是提取数组中的某个元素，现在能支持到的就是提取出数组中的前 n 个元素、后 n 个元素。

在这里可以使用 $first、$firstN、$last、$lastN 这样的运算符，它们的语法分别如下：

{ $first: <expression> }

{
    $firstN: {
        input: <expression>,
        n: <expression>
    }
}

{ $last: <expression> }

{
    $lastN: {
        input: <expression>,
        n: <expression>
    }
}

其他运算

除了上述的累加器，聚合框架还有非常多其他的累加器，这里简单列一下：

$accumulator: 返回自定义累加器函数的结果
$addToSet: 返回一个无重复值的数组
$bottom: 返回指定排序规则后最后 1 个元素
$bottomN: 返回指定排序规则后最后 n 个元素
$count: 返回文档的计数
$mergeObjects: 返回合并多个对象之后的结果
$push: 返回一个可以有重复值的数组
$stdDevPop: 返回输入值的总体标准差
$stdDevSamp: 返回输入值的样本标准差

这些累加器都有各自的用法，使用得当可实现非常强大的数据分析功能，完整的内容可以到官方文档上查看。

到此这篇关于MongoDB 聚合查询详解的文章就介绍到这了,更多相关MongoDB聚合查询内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

MongoDB Shell常用基本操作命令详解

目录 MongoDB Shell 连接数据库库(database)的操作查看所有数据库 test 库查看当前数据库删除数据库集合的基本操作创建集合查看集合删除集合其他 Shell 命令清屏退出 shell 小结 MongoDB Shell MongoDB Shell 是一个功能齐全的 JS 和 Node.js 的REPL环境,用于与 MongoDB 服务器进行交互,是一个 shell 环境的客户端工具. 本文介绍一些 MongoDB Shell 的常用操作. 连接数据库使
MongoDB 数据模型的设计模式及优缺点

目录简介近似值模式属性模式桶模式计算模式文档版本控制模式扩展引用模式异常值模式预分配模式模式版本控制模式子集模式树形模式在实际开发中,大多数性能问题都可以追溯到糟糕的模型设计.官方也提供分享过文档模型设计的进阶技巧,这里简单翻译记录一下. 简介官方文章的地址是 Building with Patterns: A Summary,其中汇总了 12 种设计模式及使用场景. 上述的图表列举了 12 种设计模式及应用场景,主要是以下这些: 近似值模式(Approximatio
MongoDB超大块数据问题解决

目录引言一.MongoDB服务器管理 1.添加服务器 2.修改分片中的服务器 3.删除分片二.均衡器三.修改块的大小四.超大块 1.分发超大块 2.分发超大块步骤: 3.避免出现超大块 4.输出内容详解: 五.系统分析器六.一些常见的辅助命令引言最近项目在使用MongoDB作为图片和文档的存储数据库,为啥不直接存MySQL里,还要搭个MongoDB集群,麻不麻烦? 让我们一起,一探究竟,继续学习解决MongoDB超大块数据问题,实现快速入门,丰富个人简历,提高面试level,给自
MongoDB中aggregate()方法实例详解

目录前言 1,了解aggergate()方法 2,实现聚合表达式运算符总结前言 MongoDB的一个很大的好处是能够使用MapReduce来吧数据库查询的结果简化成一个与原来的集合完全不同的结构.MapReduce把一个数据库查询的值映射为一个完全不同的形式,然后简化结果,使它们的可用性更好. MongoDB有一个MapReduce框架,它也允许你使用聚合来简化吧一个MapReduce操作传输到另一个MapReduce操作的一系列过程.有了MapReduce和聚合,可以用数据生成一些不平凡
Mongodb 用户权限管理及配置详解

一.Mongodb命令理解 admin 数据库安装 MongoDB 时,会自动创建 admin 数据库,这是一个特殊数据库,提供了普通数据库没有的功能. 有些用户角色赋予用户操作多个数据库的权限,而这些角色只能在 admin 数据库中创建,要创建有权操作所有数据库的超级用户,必须将该用户加入到 admin 数据库中.检查凭证时,MongoDB 将在指定数据库和 admin 数据库中检查用户账户. 内建的角色数据库用户角色:read.readWrite;数据库管理角色:dbAdmin.dbO
Mongodb中MapReduce实现数据聚合方法详解

Mongodb是针对大数据量环境下诞生的用于保存大数据量的非关系型数据库,针对大量的数据,如何进行统计操作至关重要,那么如何从Mongodb中统计一些数据呢? 在Mongodb中,给我们提供了三种用于数据聚合的方式: (1)简单的用户聚合函数: (2)使用aggregate进行统计: (3)使用mapReduce进行统计: 今天我们首先来讲讲mapReduce是如何统计,在后续的文章中,将另起文章进行相关说明. MapReduce是啥呢?以我的理解,其实就是对集合中的各个满足条件的文档进行预处理
MySQL必备基础之分组函数聚合函数分组查询详解

目录一.简单使用二.搭配DISTINCT去重三.COUNT()详细介绍四.分组查询一.简单使用 SUM:求和(一般用于处理数值型) AVG:平均(一般用于处理数值型) MAX:最大(也可以用于处理字符串和日期) MIN:最小(也可以用于处理字符串和日期) COUNT:数量(统计非空值的数据个数) 以上分组函数都忽略空NULL值的数据 SELECT SUM(salary) AS 和,AVG(salary) AS 平均,MAX(salary) AS 最大,MIN(salary) AS 最小
PHP7之Mongodb API使用详解

编译安装PHP7 编译安装PHP7 Mongdb扩展 #先安装一个依赖库yum -y install openldap-develwget https://pecl.php.net/get/mongodb-1.1.1.tgz /home/server/php7/bin/phpize #根据自己编译的PHP环境而定./configure --with-php-config=/home/server/php7/bin/php-config make && make install#如果成功
Laravel框架中集成MongoDB和使用详解

* 推荐组件 composer require jenssegers/mongodb ^3.3 -vvv(本人的laravel版本是5.5) 修改config/app.php * 注册服务 Jenssegers\Mongodb\MongodbServiceProvider::class, * 添加 Facades 'Mongo' => Jenssegers\Mongodb\MongodbServiceProvider::class, * 修改数据库配置文件 config/database.php
SpringBoot整合MongoDB的步骤详解

项目结构: 1.pom引入mongodb依赖 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-mongodb</artifactId> </dependency> 2 配置application.properties #spring.data.mongodb.host=127.0.0.1 #spr
c# Linq查询详解

c#提供的ling查询极大的遍历了集合的查询过程,且使用简单方便,非常的有用. 下面将分别用简单的例子说明:ling基本查询.延迟查询属性.类型筛选.复合from字句.多级排序.分组查询.联合查询.合并.分页.聚合操作符.并行linq.取消长时间运行的并行ling查询. Lambda表达式简介: /*Lambda表达式:Lambda 表达式是一种可用于创建委托或表达式目录树类型的匿名函数表达式位于 => 运算符右侧的 lambda 表达式称为"表达式 lambda". * (i
Java连接MongoDB的常用方法详解

目录一.Java链接MongoDB 二.查看库,查看集合三.Java对MongoDB增删改查 1. 添加数据 2. 删除数据 3. 修改数据 4. 查询数据一.Java链接MongoDB 1. 导入Mongo驱动包 2. 获取Mongo链接对象 MongoClient mc = new MongoClient("localhost",27017); 3. 关闭链接 mc.close(); 二.查看库,查看集合 1. 获取库对象 MongoDatabase db = mc.getD
Python操作MongoDB的教程详解(插,查,改,排,删)

目录插入文档插入集合返回 _id 字段插入多个文档插入指定 _id 的多个文档查询文档查询一条数据查询集合中所有数据查询指定字段的数据根据指定条件查询高级查询返回指定条数记录修改文档排序删除数据删除多个文档删除集合中的所有文档删除集合 MongoDB 是一个基于分布式文件存储的数据库.是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的. MongoDB 是目前最流行的 NoSQL 数据库之一,使用的数据类型 BSON(
MySQL常用聚合函数详解

一.AVG AVG(col) 返回指定列的平均值二.COUNT COUNT(col) 返回指定列中非NULL值的个数三.MIN/MAX MIN(col):返回指定列的最小值 MAX(col):返回指定列的最大值四.SUM SUM(col) 返回指定列的所有值之和五.GROUP_CONCAT GROUP_CONCAT([DISTINCT] expr [,expr ...] [ORDER BY {unsigned_integer | col_name | expr}
mysql5.7.10开启慢查询详解

如下所示: #在/etc/my.cnf中的[mysqld]中加入如下代码: slow-query-log=On slow_query_log_file=/data/mysql/log/mysql_slow_query.log long_query_time=2 log_queries_not_using_indexes = ON 第一句是开启慢查询第二句是用来定义慢查询日志的路径第三句是用来定义查过多少秒的查询算是慢查询,我这里定义的是2秒第四句就是记录下没有使用索引的query 以上这篇

MongoDB 聚合查询详解

目录

聚合管道

管道阶段

常见操作

更多操作 - 投影

更多操作 - 展开

更多操作 - 分组

更多操作 - 入库

条件组累加器

算术运算

最值运算

数组提取

其他运算

MongoDB 聚合查询详解

目录

聚合管道

管道阶段

常见操作

更多操作 - 投影

更多操作 - 展开

更多操作 - 分组

更多操作 - 入库

条件组累加器

算术运算

最值运算

数组提取

其他运算

相关推荐

随机推荐