聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。
语法:db.集合名称.aggregate({管道:{表达式}}
【match管道的输出是group管道的输入】
在mongodb中,⽂档处理完毕后, 通过管道进⾏下⼀次处理。
常用管道命令如下:
$group
: 将集合中的⽂档分组, 可⽤于统计结果。$match
: 过滤数据, 只输出符合条件的⽂档。$project
: 修改输⼊⽂档的结构, 如重命名、 增加、 删除字段、 创建计算结果。$sort
: 将输⼊⽂档排序后输出。$limit
: 限制聚合管道返回的⽂档数。$skip
: 跳过指定数量的⽂档, 并返回余下的⽂档。
表达式:处理输⼊⽂档并输出 语法:表达式:'$列名'
常⽤表达式:
$sum
: 计算总和, $sum:1 表示以⼀倍计数。$avg
: 计算平均值。$min
: 获取最⼩值。$max
: 获取最⼤值。$push
: 在结果⽂档中插⼊值到⼀个数组中。
$group
3.1 按照某个字段进行分组
$group
是所有聚合命令中用的最多的一个命令,用来将集合中的文档分组,可用于统计结果。
使用示例如下:
db.stu.aggregate(
{$group:
{
_id:"$gender",
counter:{$sum:1}
}
}
)
【_id是分组结果后的键】【处理_id之外的所有键都是可以自行定义的】
其中注意点:
db.db_name.aggregate
是语法,所有的管道命令都需要写在其中_id
表示分组的依据,按照哪个字段进行分组,需要使用$gender
表示选择这个字段进行分组$sum:1
表示把每条数据作为1进行统计,统计的是该分组下面数据的条数
当我们需要统计整个文档的时候,$group
的另一种用途就是把整个文档分为一组进行统计 【即不分组】
使用实例如下:
db.stu.aggregate(
{$group:
{
_id:null,
counter:{$sum:1}
}
}
)
其中注意点:
_id:null
表示不指定分组的字段,即统计整个文档,此时获取的counter
表示整个文档的个数
正常情况在统计的不同性别的数据的时候,需要知道所有的name,需要逐条观察,如果通过某种方式把所有的name放到一起,那么此时就可以理解为数据透视。
使用示例如下:
3.3.1.统计不同性别的学生
db.stu.aggregate(
{$group:
{
_id:null,
name:{$push:"$name"}
}
}
)
3.3.2.使用$$ROOT
可以将整个文档放入数组中
db.stu.aggregate(
{$group:
{
_id:null,
name:{$push:"$$ROOT"}
}
}
)
$match
$match
用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find
区别在于$match
操作可以把结果交给下一个管道处理,而find
不行。
使用示例如下:
4.1 查询年龄大于等于18岁的人物 db.stu.aggregate(
{$match:{age:{$gt:18}}
)
db.stu.aggregate(
{$match:{age:{$gt:20}}
{$group:{_id:"$gender",counter:{$sum:1}}}
)
$project
$project
用于修改文档的输入输出结构,例如重命名,增加,删除字段。
注意:只有_id可以写0,其余的字段不能写0,默认是0不显示。
使用示例如下:
5.1 查询人物的年龄、姓名,仅输出年龄姓名 db.stu.aggregate(
{$project:{_id:0,name:1,age:1}}
)
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}}
{$project:{_id:0,counter:1}}
)
$sort
$sort
用于将输入的文档排序后输出。
使用示例如下:
6.1 查询人物信息,按照年龄升序 db.stu.aggregate({$sort:{age:1}})
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}}
)
$skip
和 $limit
$limit
限制返回数据的条数$skip
跳过指定的文档数,并返回剩下的文档数- 同时使用时先使用skip在使用limit
使用示例如下:
7.1 查询2条人物信息 db.stu.aggregate(
{$limit:2}
)
db.stu.aggregate(
{$skip:3}
)
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}},
{$skip:1},
{$limit:1}
)