文档:https://docs.mongodb.com/manual/tutorial/install-mongodb-on-ubuntu/
安装
1.直接下载安装
sudo apt-get install -y mongodb # -y 跳过提示y/n的选择 默认全部是y
服务端mongodb启动
查看帮助:mongod –help
启动:sudo service mongod start
停止:sudo service mongod stop
重启:sudo service mongod restart
查看是否启动成功:ps ajx|grep mongod / ps -ef | grep mongod
配置文件的位置:/etc/mongod.conf,
默认端⼝:27017
日志的位置:/var/log/mongodb/mongod.log
2.先下载,再安装
服务端mongodb启动
mongod --config + 路径
mongod --config /usr/local/mongodb/mongod.conf
启动本地客户端
mongo
查看帮助:
mongo –help
退出:
exit / ctrl+c
数据的备份和恢复
备份
备份的语法:
mongodump -h dbhost -d dbname -o dbdirectory
-h: 服务器地址, 也可以指定端⼝号
-d: 需要备份的数据库名称
-o: 备份的数据存放位置, 此⽬录中存放着备份出来的数据
mongodump -h 192.168.196.128:27017 -d test1 -o ~/Desktop/test1bak
恢复
恢复语法:
mongorestore -h dbhost -d dbname --dir dbdirectory
-h: 服务器地址
-d: 需要恢复的数据库实例
--dir: 备份数据所在位置
mongorestore -h 192.168.196.128:27017 -d test2 --dir ~/Desktop/test1bak/test1
数据类型
Object ID: ⽂档ID
String: 字符串, 最常⽤, 必须是有效的UTF-8
Boolean: 存储⼀个布尔值, true或false
Integer: 整数可以是32位或64位, 这取决于服务器
Double: 存储浮点值
Arrays: 数组或列表, 多个值存储到⼀个键
Object: ⽤于嵌⼊式的⽂档, 即⼀个值为⼀个⽂档
Null: 存储Null值
Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数
Date: 存储当前⽇期或时间的UNIX时间格式
注意点
创建⽇期语句如下 :参数的格式为YYYY-MM-DD
new Date('2017-12-20')
每个⽂档都有⼀个属性, 为_id, 保证每个⽂档的唯⼀性
可以⾃⼰去设置_id插⼊⽂档,如果没有提供, 那么MongoDB为每个⽂档提供了⼀个独特的_id, 类型为objectID
objectID是⼀个12字节的⼗六进制数:
前4个字节为当前时间戳
接下来3个字节的机器ID
接下来的2个字节中MongoDB的服务进程id
最后3个字节是简单的增量值
操作数据库
查看当前的数据库:
db
查看所有的数据库:
show dbs /show databases
切换数据库:use 数据库名字
use test100
删除当前的数据库:
db.dropDatabase()
操作集合
插入
不手动创建集合:
向不存在的集合中第⼀次加⼊数据时, 集合会被创建出来 如
手动创建结合:db.createCollection(name,options)
db.createCollection("stu") db.createCollection("sub", { capped : true, size : 10 } ) # 设置存储最大字节
参数capped: 默认值为false表示不设置上限,值为true表示设置上限
参数size: 当capped值为true时, 需要指定此参数, 表示上限⼤⼩,当⽂档达到上限时, 会将之前的数据覆盖, 单位为字节
查看集合:
show collections
删除集合:db.集合名称.drop()
db.sku.drop()
操作数据
插入数据
db.集合名称.insert(document)
db.stu.insert({name:'gj',gender:1})
db.stu.insert({_id:"20170101",name:'gj',gender:1})
插⼊⽂档时, 如果不指定_id参数, MongoDB会为⽂档分配⼀个唯⼀的ObjectId
保存
db.集合名称.save(document)
db.stu.save({name:"zhang",gender:1})
db.stu.insert({_id:"20170101",name:'gj',gender:0}) # 报错,因为_id为20170101已经存在,不能再插入 _id是唯一的
db.stu.save({_id:"20170101",name:'gj',gender:0}) # 更改
如果⽂档的_id已经存在则修改, 如果⽂档的_id不存在则添加
简单查询
db.集合名称.find()
db.stu.find()
更新
db.集合名称.update(<query> ,<update>,{multi: <boolean>})
参数query:查询条件
参数update:更新操作符
参数multi:可选, 默认是false,表示只更新找到的第⼀条记录, 值为true表示把满⾜条件的⽂档全部更新
db.stu.update({name:'hr'},{name:'mnc'}) 更新一条 回吧符合{name:'hr'}的数据替换成{name:'mnc'}
注:此时age的数据不见了
db.stu.update({name:'hr'},{$set:{name:'hys'}}) 更新一条 只会替换name的部分
使用$set后只会更新name的值,age不变
db.stu.update({},{$set:{gender:0}},{multi:true}) 更新全部 multi:true更新多条,multi:false更新一条 默认位false 只有跟$符一起使用的时候才会生效
注意:"multi update only works with $ operators"
删除
db.集合名称.remove(<query>,{justOne: <boolean>})
参数query:可选,删除的⽂档的条件
参数justOne:可选, 如果设为true或1, 则只删除⼀条, 默认false, 表示删除多条
db.test1.remove({name:"lisi"},{justOne:true}) #name是lisi的数据删除第一条 db.test1.remove({name:"lisi"}) # name是lisi的数据全部删除
高级查询
条件查询
⽅法find(): 查询
db.集合名称.find({条件⽂档})
db.test1.find({name:18})
⽅法findOne():查询,只返回第⼀个
db.集合名称.findOne({条件⽂档})
⽅法pretty(): 将结果格式化
db.集合名称.find({条件⽂档}).pretty()
比较运算符
等于: 默认是等于判断, 没有运算符
⼩于:$lt (less than)
⼩于等于:$lte (less than equal)
⼤于:$gt (greater than)
⼤于等于:$gte
不等于:$ne
db.stu.find({age:{$gte:18}})
逻辑运算符
and:在json中写多个条件即可
查询年龄⼤于或等于18, 并且性别为true的学⽣
db.stu.find({age:{$gte:18},gender:true})
or:使⽤$or, 值为数组, 数组中每个元素为json
查询年龄⼤于18, 或性别为false的学⽣
db.stu.find({$or:[{age:{$gt:18}},{gender:false}]})
查询年龄⼤于18或性别为男⽣, 并且姓名是郭靖
db.stu.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'})
范围运算符
使⽤"$in" 在[]范围内
"$nin" 不在[]范围内
判断是否在某个范围内
查询年龄为18、 28的学⽣
db.stu.find({age:{$in:[18,28]}})
正则表达式
使⽤//或$regex编写正则表达式
查询姓⻩的学⽣
db.stu.find({name:/^⻩/})
db.stu.find({name:{$regex:'^⻩'}})
limit和skip
⽅法limit(): ⽤于读取指定数量的⽂档
db.集合名称.find().limit(NUMBER)
查询2条学⽣信息
db.stu.find().limit(2) # 选中前两个
⽅法skip(): ⽤于跳过指定数量的⽂档
db.集合名称.find().skip(NUMBER)
db.stu.find().skip(2) # 跳过前两个,取后面的
同时使用
db.stu.find().limit(4).skip(5) # 先跳过5个,再选择4个
或
db.stu.find().skip(5).limit(4) # 跳过5个 再选择4个 建议用这种 效率比上一个快
自定义查询
使⽤$where后⾯写⼀个函数, 返回满⾜条件的数据
查询年龄⼤于30的学⽣
db.stu.find({
$where:function() {
return this.age>30;}
})
投影
在查询到的返回结果中, 只选择必要的字段
db.集合名称.find({},{字段名称:1,...})
参数为字段与值, 值为1表示显示, 默认不写就不显
特殊: 对于_id列默认是显示的, 如果不显示需要明确设置为0
db.stu.find({},{_id:0,name:1,gender:1})
排序
⽅法sort(), ⽤于对 集进⾏排序
db.集合名称.find().sort({字段:1,...})
参数1为升序排列
参数-1为降序排列
根据性别降序, 再根据年龄升序
db.stu.find().sort({gender:-1,age:1})
统计个数
⽅法count()⽤于统计结果集中⽂档条数
db.集合名称.find({条件}).count()
db.集合名称.count({条件})
db.stu.find({gender:true}).count()
db.stu.count({age:{$gt:20},gender:true})
注意:db.stu.find().count({age:18}) 这种事按照find()查找出来的统计个数,count()里面的条件不起作用
消除重复
⽅法distinct()对数据进⾏去重
db.集合名称.distinct('去重字段',{条件})
db.stu.distinct('hometown',{age:{$gt:18}})
聚合(重点)
聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。
db.集合名称.aggregate({管道:{表达式}})
常⽤管道
在mongodb中,⽂档处理完毕后, 通过管道进⾏下⼀次处理
常用管道如下:
$group: 将集合中的⽂档分组, 可⽤于统计结果
group文档:https://docs.mongodb.com/manual/reference/operator/aggregation/group/
所有文档数据分为一组
透视数据
$$ROOT 该集合内所有符合条件的数据
注意点:
$group的注意点 - `$group`对应的字典中有几个键,结果中就有几个键 - 分组依据需要放到`_id`后面 - 取不同的字段的值需要使用$,`$gender`,`$age` - 取字典嵌套的字典中的值的时候`$_id.country` - 能够同时按照多个键进行分组`{$group:{_id:{country:"$country",province:"$province"}}}` # 可用来做去除重复 - 结果是:`{_id:{country:"",province:""}`
$match
过滤数据, 只输出符合条件的⽂档
match是管道命令,能将结果交给后一个管道,但是find不可以
$project: 修改输⼊⽂档的结构, 如重命名、 增加、 删除字段、 创建计算结果
$sort: 将输⼊⽂档排序后输出
{$sort:{排序的字段名:-1倒序 1正序}}
$limit: 限制聚合管道返回的⽂档数
$skip: 跳过指定数量的⽂档, 并返回余下的⽂档
$unwind: 将数组类型的字段进⾏拆分
将⽂档中的某⼀个数组类型字段拆分成多条, 每条包含数组中的⼀个值
语法:db.集合名称.aggregate({$unwind:'$字段名称'})
db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})
db.t2.aggregate({$unwind:'$size'})
统计数组类型字段的个数
属性 值为false表示丢弃属性值为空的⽂档
属性preserveNullAndEmptyArrays值为true表示保留属性值为空的⽂档
用法:
常用表达式
处理输⼊⽂档并输出
语法:表达式:'$列名'
常⽤表达式:
$sum: 计算总和, $sum:1 表示以⼀倍计数
$avg: 计算平均值
$min: 获取最⼩值
$max: 获取最⼤值
$push: 在结果⽂档中插⼊值到⼀个数组中
$first: 根据资源⽂档的排序获取第⼀个⽂档数据
$last: 根据资源⽂档的排序获取最后⼀个⽂档数据
建立索引
索引:以提升查询速度
db.t255.find({name:'test10000'}).explain('executionStats') # 统计查询数据需要使用多少时间
建立索引之后对比:
语法:db.集合.ensureIndex({属性:1}),1表示升序, -1表示降序
具体操作:db.t1.ensureIndex({name:1})
db.t1.find({name:'test10000'}).explain('executionStats')
在默认情况下创建的索引均不是唯一索引。
创建唯一索引:
db.t1.ensureIndex({"name":1},{"unique":true})
创建唯一索引并消除重复:
db.t1.ensureIndex({"name":1},{"unique":true,"dropDups":true})
建立联合索引(什么时候需要联合索引):
db.t1.ensureIndex({name:1,age:1})
查看当前集合的所有索引:
db.t1.getIndexes()
删除索引:
db.t1.dropIndex('索引名称')