MongoDB除了基本查询功能之外,还有强大的聚合工具,其中包括:count()、distinct()、group()、mapreduce.

计数函数count

count是最简单的聚合工具,用于返回文档的数量:

>db.user.count() // 返回集合user的个数

传递查询文档时,则计算查询结果的数量:

>db.user.count({"age":{"$lt":20}}) // 返回年龄小于20岁的用户数

该函数对于分页时的总数非常有必要

去重函数distinct

distinct函数用来找出给定键的所有不同的值。使用时必须指定集合和键:

>db.runCommand({"distinct":"user","key":"age"}) // 获取age键的不同的值

有时候需要获取集合中所有不同的键,此时需要自己编写MapReduce,内置没有这样的函数。

values返回键所对应的所有不同的值,数组形式。

stats返回distinct过程的一些指标。

n:返回的集合数量,

nscanned:扫描过的文档数量,

timems:耗费的时间(毫秒),

cursor:使用的索引(BasicCursor:无索引,BtreeCursor)

分组函数group

MongoDB会根据分组依据的键将集合分成若干个组,再聚合每个组内的文档。

>db.runCommand({"group":{

"ns":"user",

"key":"day",

"initial":{"time":0},

"$reduce":function(doc,prev){

if(doc.time>prev.time){

prev.price = doc.price;

prev.time = doc.time;

}

},

"condition":{"day":{"$gt":"2014/12/21"}}

}})

"ns":"user":指定分组的集合为user

"key":"day":指定文档分组依据的键

"initial":{"time":0}每一组reduce函数调用的时间,会作为初始文档传递给后续过程。

"$reduce":每个文档都对应一次这个调用。系统会传递两个参数:当前文档和累加器文档。

"condition":指定条件

使用完成器:finalizer

完成器finalizer用于精简数据库传给用户的数据,group命令的输出一定要能放到单个数据库响应中。

>db.runCommand({"group":{

"ns":"post",

"key":"{"tags":true}", // 等同于"key":"tags"

"initial":{"tags":{}},

"$reduce":function(doc,prev){

for(i in doc.tags){

if(doc.tags[i] in prev.tags){

prev.tags[doc.tags[i]]++;

}else{

Prev.tags[doc.tags[i]]=1;

},

"finalize":function(prev){

var mostPopular = 0;

for(i in prev.tags){

if(prev.tags[i]>mostPopular){

prev.tag=i;

mostPopular=prev.tags[i];

}

}

Detete prev.tags

}

}}})

将$reduce处理后的结果再进行处理,然后返回给客户端。

将函数作为键使用

定义分组函数时使用"$keyf"代替"key":

"$keyf":function(x){return x.category.toLowerCase();}

MapReduce

count、distict、group能做的事,MapReduce都能做。MapReduce的基本使用如下:

>mr=db.runCommand({"mapreduce":"user","map":map,"reduce":reduce})

"mapreduce":对哪个集合作处理

"map":map函数,可以在上述命令前先定义

"reduce":reduce函数,可以在上述命令前先定义

map函数使用函数emit返回要处理的值,this表示对当前文档的引用:

>map=function(){

for(var key in this){

emit(key,{ "count":1});

}};

reduce能处理emit返回的文档和其他reduce结构的各种组合:

>reduce=function(key,emits){

total = 0;

for(var I in emits){

total+=emits[i].count;

}

return {"count":total};

}

MapReduce函数的返回文档类似如下:

result:存放mapreduce结果的集合名,为临时集合,mapreduce连接关闭后自动删除。

timeMillis:操作花费的时间,单位毫秒

input:发生到map函数的文档个数

emit:在map函数中emit被调用的次数

output:结果集合中创建的文档数量。

MapReduce的其他可选键

MapReduce命令除了必须的键:mapreduce、map、reduce之外,还有如下的可选键:

finalize:对reduce的输出结果作进一步处理

keeptemp:连接关闭时,临时集合是否保存。

output:结果集合的名字,设定该项则隐含着keeptemp:true。

query:会在发往map函数前,先用指定条件过滤文档。

sort:在发往map前先给文档排序。

limit:发往map函数的文档数量的上限。

scope:javaScript代码中要用到的变量(变量名:值)。

verbose:是否产生更加详细的服务器日志。

MongoDB学习笔记-05 聚合的更多相关文章

  1. MongoDB学习笔记05

    count 返回集合中文档数量文档数量 db.foo.count() db.foo.count({}) distinct用来找出给定键的所有不同的值,使用时必须指定集合和键 db.runCommand ...

  2. mongodb 学习笔记05 --用户管理

    csdn的markdown编辑器真有够烂的,这篇文章又给弄丢了 启用认证 mongod 启动默认没有开启权限,你须要指定 –auth 启动.或者在配置文件里设置security.authorizati ...

  3. mongoDB 学习笔记纯干货(mongoose、增删改查、聚合、索引、连接、备份与恢复、监控等等)

    最后更新时间:2017-07-13 11:10:49 原始文章链接:http://www.lovebxm.com/2017/07/13/mongodb_primer/ MongoDB - 简介 官网: ...

  4. MongoDB 学习笔记(原创)

    MongoDB 学习笔记 mongodb 数据库 nosql 一.数据库的基本概念及操作 SQL术语/概念 MongoDB术语/概念 解释/说明 database database 数据库 table ...

  5. MongoDB学习笔记系列

    回到占占推荐博客索引 该来的总会来的,Ef,Redis,MVC甚至Sqlserver都有了自己的系列,MongoDB没有理由不去整理一下,这个系列都是平时在项目开发时总结出来的,希望可以为各位一些帮助 ...

  6. PHP操作MongoDB学习笔记

    <?php/*** PHP操作MongoDB学习笔记*///*************************//**   连接MongoDB数据库  **////*************** ...

  7. MongoDB学习笔记—权限管理

    1.MongoDB权限介绍 a 上篇文章中,我们在Linux下配置了MongoDB环境并且将其设置为服务随机器启动而启动,那么接下来这篇文章我们就来简单说一下MongoDB下对登录用户权限的管理. b ...

  8. MongoDB学习笔记—Linux下搭建MongoDB环境

    1.MongoDB简单说明 a MongoDB是由C++语言编写的一个基于分布式文件存储的开源数据库系统,它的目的在于为WEB应用提供可扩展的高性能数据存储解决方案. b MongoDB是一个介于关系 ...

  9. MongoDB学习笔记~环境搭建

    回到目录 Redis学习笔记已经告一段落,Redis仓储也已经实现了,对于key/value结构的redis我更愿意使用它来实现数据集的缓存机制,而对于结构灵活,查询效率高的时候使用redis就有点不 ...

随机推荐

  1. Play Framework 完整实现一个APP(五)

    程序以及基本可用了,需要继续完善页面 1.创建页面模板 创建文件 app/views/tags/display.html *{ Display a post in one of these modes ...

  2. Java的序列化ID的作用

    Java的序列化ID的作用 简单来说,Java的序列化机制是通过在运行时判断类的serialVersionUID来验证版本一致性的.在进行反序列化时,JVM会把传来的字节流中的serialVersio ...

  3. .net之工作流工程展示及代码分享(三)数据存储引擎

    数据存储引擎是本项目里比较有特色的模块. 特色一,使用接口来对应不同的数据库.数据库可以是Oracle.Sqlserver.MogoDB.甚至是XML文件.采用接口进行对应: public inter ...

  4. ROS 常用命令字典

    版权声明:本文为博主原创文章,转载请标明出处: http://www.cnblogs.com/liu-fa/p/5761448.html 该博文适合已经具备一定的ROS编程基础的人,快速查看ROS相关 ...

  5. 隐知识:reloadData 方法之后,view并不会立即更新其contentSize

    在使用UITableView .UICollectionView ,调用reloadData方法之后,并不立即更新其contentSize.原因如下:http://jacksonriver.com/n ...

  6. Outlook 2013 在邮件里面点击超链接时弹出&ldquo;组织策略阻止我们为您完成此操作&rdquo;

    现象描叙:     在Outlook在邮件里面点击超链接时,打不开超链接页面,弹出如下提示: 这个是因为之前安装了其它浏览器(例如,我安装了360的浏览器),并且设置为了默认浏览器,后来卸载了该浏览器 ...

  7. 磁盘操作- inode/Block深入实战

    一 思路: 1,磁盘物理结构及大小计算 2,分区 MBR GPT知识 3,fdisk分区 挂载 自动挂载 4,格式化文件系统 5,inode block 软硬链接 查看磁盘: [root@moban ...

  8. SQL数据类型大全 《转自网络》

    数据类型是数据的一种属性,表示数据所表示信息的类型.任何一种计算机语言都定义了自己的数据类型.当然,不同的程序语言都具有不同的特点,所定义的数据类型的种类和名称都或多或少有些不同.SQLServer ...

  9. LintCode &quot;The Smallest Difference&quot;

    Binary search. class Solution { int _findClosest(vector<int> &A, int v) { , e = A.size() - ...

  10. Jquery插件(CKEditor)

    描述 在html页面实现像word一样的编辑功能(可视化HTML编辑器) 解决方法 ckeditor插件官方网站 http://ckeditor.com/ 使用 1:去官方下载ckeditor插件,添 ...