wcleonard

导航

 
数据库  MongoDB  (芒果数据库)

数据存储阶段

文件管理阶段 (.txt .doc .xls)
优点 : 数据可以长期保存
可以存储大量的数据
使用简单

缺点 : 数据一致性差
数据查找修改不方便
数据冗余度可能比较大

数据库管理阶段

优点 : 数据组织结构化降低了冗余度
提高了增删改查的效率
容易扩展
方便程序调用,做自动化处理

缺点 :需要使用sql 或者 其他特定的语句,相对比较复杂

几个概念

数据 : 能够输入到计算机中并被识别处理的信息集合

数据结构 :研究一个数据集合中数据之间关系的

数据库 : 按照数据结构,存储管理数据的仓库。数据库是在数据库 管理系统管理和控制下,在一定介质上的数据集合。

数据库管理系统 :管理数据库的软件,用于建立和维护数据库

数据库系统 : 由数据库和数据库管理系统,开发工具等组成的集合


关系型数据库

采用关系模型来组织数据结构的数据库 (二维表)

Oracle DB2 SQLServer MySql SqLite(Python标准库支持)

优点 :容易理解,类似我们常见的表格
使用方便,都是使用sql语句,SQL语句非常成熟
数据一致性高,冗余度低,完整性好
技术成熟,可以使用外部链接等比较复杂的操作

缺点 :不能很好的满足高并发需求,每次都需要进行sql语句的解析

针对含量数据的瞬间爆发读写性能不足,关系型数据库内部每步操作都需要加锁保证操作的原子性

数据扩展普遍比非关系型困难
数据一致性高,有时会浪费大量空间

非关系型数据库 (NoSql --> Not only Sql)
优点 : 高并发,大数据读写能力强
支持分布式,容易扩展
弱化了数据结构,降低了数据的一致性

缺点 : 通用性差,没有像sql那样一致的操作
操作灵活,容易混乱
没有join,有的数据库事务支持等操作

Nosql的使用情况:

1. 数据一致性要求低
2. 数据库并发处理要求高
3. 数据库设计时对大小的估算不确定,需要分布拓展
4. 给定的数据比较容易建立起Nosql的模型

Nosql分类:
1. 键值型数据库
Redis oracle BDB Tokyo
2. 列存储数据库
HBase
3. 文档型数据库
MongoDB CouchDB
4. 图形数据库


MongoDB(非关系型 --》文档型数据库)
1. 由c++编写的数据库管理系统
2. 支持非常丰富的增删改查数据操作
3. 支持非常丰富的数据类型
4. 使用方便,便于部署,支持分布,容易拓展
5. 支持众多的编程语言接口 (python ruby c++ c# PHP)

MongoDB 安装

自动安装
sudo apt-get install mongodb

默认安装位置 /var/lib/mongodb
配置文件 /etc/mongodb.conf
命令集 /usr/bin /usr/local/bin

手动安装

1.下载MongoDB (开源)
www.mongodb.com ---》 Download ---》 community server
选择合适版本下载

2. 选择安装目录解压 (/usr/local /opt)
tar解压后得到mongo文件夹

3. 将文件夹下的命令集目录 (bin目录)添加到环境变量
PATH=$PATH:/opt/mongo....../bin
export PATH
将以上两句写在 /etc/rc.local

4.重启系统

mongodb 命令

设置数据库存储位置
mongod --dbpath 目录
设置端口号
mongod --port 8888
*如果不设置则使用默认端口号 27017

mongo
进入mongo shell界面 mongodb的交互界面用来操作数据库

退出 mongo shell : quit()

组成结构: 键值对 ---》 文档 ----》集合 ----》 数据库

----------------------------
ID | name | age
----------------------------
1 | Lily | 17
----------------------------
2 | Lucy | 18
----------------------------
{
"_id":ObjectId("abcd1234afhkasyr"),
"name":"Lily",
"age":17
},
{
"_id":ObjectId("abcd1234afasfsyr"),
"name":"Lucy",
"age":18
}

mysql 和 mongodb 概念对比

mysql mongo 含义

database database 数据库

table collection 表/集合

column field 字段/域

row document 记录/文档

index index 索引


创建数据库

use databasename

e.g.
创建一个叫 stu 的数据库
use stu

* use实际功能是表示选择使用哪个数据库,当这个数据库不存在时即表示创建该数据库
* 使用use后数据库并不会马上被创建,而是需要插入数据后数据库才会创建

查看数据库
show dbs

数据库名称规则
1. 原则上是任意满足以下几条的utf-8字符
2. 不能是空字符,不能含有空格' ' 点'.' '/' '\' '\0'
3. 习惯上使用英文小写
4. 长度不超过64字节
5. 不能使用 admin local config 这样的名字

admin : 存储用户
local : 存储本地数据
config : 存储分片配置信息

db : mongo系统全局变量 代表你当前正在使用的数据库

db 默认为test 如果插入数据即创建test数据库

数据库的备份和恢复

备份 mongodump -h dbhost -d dbname -o dbdir

e.g. mongodump -h 127.0.0.1 -d stu -o student
将本机下 stu 数据库备份到 当前目录的student文件夹中
会在student文件夹中自动生成一个stu文件夹则为备份文件

恢复 mongorestore -h <dbhost>:<port> -d dbname <path>

e.g. mongorestore -h 127.0.0.1:27017 -d test student/stu
将student文件夹下的备份文件stu恢复到本机的test数据库

数据库的监测命令
mongostat
insert query update delete :每秒增查改删的次数
getmore command 每秒运行命令次数
dirty used flushes 每秒操作磁盘的次数
vsize res 使用虚拟内存和物理内存

mongotop
监测每个数据库的读写时长

ns total read write
数据集合 总时长 读时长 写时长

删除数据库

db.dropDatabase()
删除db所代表的数据库

集合的创建

db.createCollection(collection_name)

e.g. db.createCollection("class2")
在当前数据库下创建一个名字为class2的集合

查看数据库中集合
show tables
show collections

集合的命名规则:
1. 不能为空字符串,不能有'\0'
2. 不能以 system.开头 这是系统集合的保留前缀
3. 不能和保留字重复

创建集合2

当向一个集合中插入文档时,如果该集合不存在则自动创建
db.collectionName.insert()

e.g. db.class0.insert({a:1})
如果class0不存在则会创建class0集合并插入该数据

删除集合
db.collectionName.drop()

e.g. db.class0.drop()
删除class0集合

集合重命名
db.collectionName.renameCollection('new_name')

e.g. db.class2.renameCollection('class0')
将class2重命名为class0


文档

mongodb 中文档的组织形式

键值对组成文档 -----》 类似Python中的字典
bson -----》 json -----》 JavaScript

mongodb 中文档的数据组织形式为bson格式,类似Python的字典,也是由键值对构成

文档中键的命名规则 :
1. utf-8格式字符串
2. 不用有\0 习惯上不用 . 和 $
3. 以_开头的多位保留键,自定义时一般不以_开头

注意 : 文档键值对是有序的
mongodb中严格区分大小写


值 : mongodb的支持数据类型

支持的数据类型

类型 值

整型 整数
布尔类型 true false
浮点型 小数
Arrays 数组类型 [1,2,3]
Timestamp 时间戳
Date 时间日期
Object 内部文档
Null 空值
Symbol 特殊字符
String 字符串
Binary data 二进制字串
code 代码
regex 正则表达式
ObjectId ObjectId子串

ObjectId : 系统自动为每个文档生成的不重复的主键
键名称: _id
值 : ObjectId("5b03b823e64cb5d90e9c8f5c")

24位16进制数
8 文档创建时间 6机器ID 4进程ID 6计数器

文档中键 -----》 域/字段
文档 ---------》 记录

集合中文档特点:
1. 集合中的文档域不一定相同 ---》不保证数据一致性
2. 集合中的文档结构不一定相同

集合设计原则:
1.集合中的文档尽可能描述的数据类似
2.同一类文档放在相同的集合,不同的文档分集合存放
3.层次的包裹不宜太多

插入文档
db.collectionName.insert()

e.g.
db.class0.insert({name:'Lucy',age:16,sex:'w'})

* 当作为文档插入时键可以不加引号

查看插入结果 db.class0.find()

插入多条文档
db.collectionName.insert([{},{},{}])

e.g. db.class0.insert([{'name':'阿花',age:28},{name:'阿红',age:26},{name:'阿彪',age:23}])

* _id 为系统自动添加主键,如果自己写_id域则会使用自己写的值。但是该值仍不允许重复。

save 插入数据
db.collectionName.save()

e.g.
db.class0.save({_id:2,name:'八戒',age:17,sex:'m'})

* 在不加_id是使用同 insert
* 如果使用save插入的时候加了_id,则如果_id值不存在则正常插入,如果该值存在,则修改原来内容
* save无法一次插入多个文档

作业 : 练习mongodb的数据库,集合创建删除
mongodb 插入练习
关系型数据库和非关系数据库都有什么特点?
mongodb的优点在哪里?

************************************************************第二天

复习 :
数据库创建删除: use 数据库名称
db.dropDatabase()
集合的创建和删除 db.createCollection('name')
db.collectionName.insert()
db.collectionName.drop() 删除
db.collectionName.renameCollection() 重命名

数据库的备份和恢复
mongodump (备份) mongorestore(恢复)
数据库的监测
mongostat mongotop
数据库配置
mongod --dbpath path --port 8888

数据的插入 : insert() save()

=====================================
db.collectionName 集合对象

获取集合对象 : db.getCollection('collection_name')

e.g.
db.getCollection("class0").insert({name:'悟空',age:1700})


查找操作

select ... from tableName where .....

db.collectionName.find() ---> select * from tableName

find(query,field)
功能 : 查找所有符合条件的文档
参数 : query : 筛选条件 相当于where字句
field : 展示的域 相当于select的展示部分
返回 : 返回所有查找到的内容

field 参数 : 选择要展示的域 传一组键值对

键表示域名
值表示是否显示该域 0 表示不显示 1 表示显示

* 如果某个域给定0 则表示不显示该域,其他的域均显示
如果某个域给定1 则表示显示该域 ,其他的域都不显示
* _id 永远默认为显示,除非设置为0
* 除_id外其他域 必须拥有相同的设置,全为0或者全为1
* 如果不写该参数则表示显示所有域内容

e.g. db.class0.find({},{_id:0,name:1,age:1})

query : 以键值对的形式给出查找条件

查找年龄 17
e.g. db.class0.find({age:17},{_id:0})
* 如果不写第一个参数则表示查找所有内容

findOne()
功能参数和find() 完全相同,只是只返回第一条查找到的文档

e.g. db.class0.findOne({age:17},{_id:0})

query的更多用法

操作符: 使用$符号注明一个特殊字符串,表示一定的含义
e.g. $lt 表示 小于

比较操作符
$eq 等于
e.g. db.class0.find({age:{$eq:17}},{_id:0})
筛选年龄等于17的
=====》 db.class0.find({age:17},{_id:0})

$lt 小于 <

e.g. db.class0.find({age:{$lt:17}},{_id:0})
* mongo中字符串也可以比较大小

$lte 小于等于 <=

e.g. db.class0.find({age:{$lte:17}},{_id:0})

$gt 大于 >
e.g. db.class0.find({age:{$gt:17}},{_id:0})

$gte 大于等于 >=
e.g. db.class0.find({age:{$gte:17}},{_id:0})

$ne 不等于 !=
e.g. db.class0.find({age:{$ne:17}},{_id:0})
* 如果一个文档没有这个age域则显示为不等于

$in 包含
e.g. db.class0.find({age:{$in:[16,17,18]}},{_id:0})

$nin 不包含

e.g. db.class0.find({age:{$nin:[16,17,18]}},{_id:0})


逻辑操作符

$and 逻辑与

年龄小于19 并且 性别为男
db.class0.find({age:{$lt:19},sex:'m'},{_id:0})
年龄小于19 并且 大于15
db.class0.find({age:{$lt:19,$gt:15}},{_id:0})

e.g. db.class0.find({$and:[{age:17},{name:'Lei'}]})

$or 逻辑或

e.g.
db.class0.find({$or:[{age:{$lt:22}},{name:'悟空'}]},{_id:0})

db.class0.find({$or:[{age:{$lt:18}},{age:{$gt:30}}]},{_id:0})

$not 逻辑非

e.g. db.class0.find({age:{$not:{$eq:17}}},{_id:0})

$nor 既不也不 (表示列表集合中的条件都不具备)

db.class0.find({$nor:[{age:{$gt:18}},{sex:'m'}]},{_id:0})

条件混合

(年龄小于20 或者 姓名为阿红) 并且 性别为女的人

db.class0.find({$and:[{$or:[{age:{$lt:20}},{name:'阿红'}]},{sex:'w'}]},{_id:0})

年龄小于等于17 或者 (姓名大于Tom 并且 年龄大于100)
db.class0.find({$or:[{age:{$lte:17}},{name:{$gt:'Tom'},age:{$gt:100}}]},{_id:0})

数组查找 :

查看数组中包含某一项的
e.g. db.class1.find({hobby:'吃'},{_id:0})

$all
查找一个数组中同时包含多项的文档

e.g. db.class1.find({hobby:{$all:['拍电影','代言']}},{_id:0})
查找hobby数组中既有拍电影,又有代言的文档

$size
查找数组元素个数为指定个数的文档
e.g. db.class1.find({hobby:{$size:3}},{_id:0})
查找hobby数组中包含三项的文档

数组切片显示
$slice
对数组切片显示

e.g.
db.class1.find({hobby:{$size:3}},{_id:0,hobby:{$slice:2}})
显示数组的前两项

e.g.
db.class1.find({hobby:{$size:3}},{_id:0,hobby:{$slice:[1,2]}})
跳过第一项,显示后面两项


其他查找方法:

$exists
判断一个域是否存在

e.g. 查找存在sex域的文档
db.class0.find({sex:{$exists:true}},{_id:0})

e.g. 查找不存在sex域的文档
db.class0.find({sex:{$exists:false}},{_id:0})

$mod
做除数余数查找

e.g.
查找年龄 被2除余1的文档
db.class0.find({age:{$mod:[2,1]}},{_id:0})

$type
查找指定数据类型的文档

e.g. 查找hobby中包含数据类型为 2 的数据的文档
db.class1.find({hobby:{$type:2}},{_id:0})

数据类型对照:
https://docs.mongodb.com/manual/reference/operator/query/type/


进一步的信息筛选

distinct()
功能 : 查看一个集合中某个域值的覆盖范围

e.g. 查看集合中age域的值都有哪些
db.class0.distinct('age')

pretty()
功能 : 将查询结果格式化显示

e.g. db.class0.find().pretty()

limit(n)
功能: 查询结果显示前 n条

e.g. 查询结果显示前3个
db.class0.find({},{_id:0}).limit(3)

skip(n)
功能 : 显示时跳过前n条

e.g. 显示时跳过前三条
db.class0.find({},{_id:0}).skip(3)

count()
功能 :对查找结果计数统计

e.g. 统计sex 为 m的文档数量
db.class0.find({sex:'m'},{_id:0}).count()

sort({键:1/-1})
功能 : 对查找结果排序
1 表示按照升序排列, -1 表示按照降序排列

对查找结果按照年龄升序排列
db.class0.find({age:{$exists:true}},{_id:0}).sort({age:1})

复合排序 : 当第一排序项相同的时候,按照第二排序项排序

db.class0.find({age:{$exists:true}},{_id:0}).sort({age:1,name:-1})

函数的连续使用
获取集合中年龄最小的三个文档
db.class0.find({},{_id:0}).sort({age:1}).limit(3)


删除文档
delete from tableName where ....

db.collectionName.remove(query,justOne)
功能 : 删除指定的文档
参数 : query : 筛选要删除的文档, 类似where子句
用法同 查找操作
justOne :布尔值 默认 false 表示删除所有筛选数据
如果赋值为true 则表示只删除第一条复合的文档

e.g.
db.class0.remove({$or:[{age:{$exists:false}},{age:{$gt:100}}]})

删除第一个复合条件的文档
db.class0.remove({sex:{$exists:false}},true)

删除集合中所有文档
db.collectionName.remove({})


练习:
1. 创建一个数据库 名字grade
use grade

2. 数据库中创建一个集合名字 class
3. 集合中插入若干数据 文档格式如下
{name:'zhang',age;10,sex:'m',hobby:['a','b','c']}
hobby: draw sing dance basketball football pingpong
computer

db.class.insert([
{name:"zhang",age:10,sex:'m',hobby:['a','b','c']},
.....
])

4. 查找练习
查看班级所有人信息
find()

查看班级中年龄为8岁的学生信息
find({age:8})

查看年龄大于10岁的学生信息
find({age:{$gt:10}})

查看年龄在 4---8岁之间的学生信息
find({age:{$gte:4,$lte:8}})

找到年龄为6岁且为男生的学生
find({age:6,sex:'m'})

找到年龄小于7岁或者大于10岁的学生
find({$or:[age:{$lt:7},age:{$gt:10}]})

找到年龄是8岁或者11岁的学生
find({age:{$in:[8,11]}})

找到兴趣爱好有两项的学生
find({hobby:{$size:2}})

找到兴趣爱好有draw的学生
find({hobby:"draw"})

找到既喜欢画画又喜欢跳舞的学生
find({hobby:{$all:["draw","dance"]}})

统计爱好有三项的学生人数
find({hobby:{$size:3}}).count()

找出本班年龄第二大的学生
find().sort({age:-1}).skip(1).limit(1)

查看学生的兴趣范围
db.class.distinct('hobby')

将学生按年龄排序找到年龄最大的三个
find().sort({age:-1}).limit(3)

删除所有 年级大于12或者小于4岁的学生
remove({$or:[{age:{$gt:12}},{age:{$lt:4}}]})

作业 : 复习 数据的查找 和删除操作
mongo练习
*********************************************************
第三天

查找 find(query,field)
findOne()

操作符 : 比较 $lt $lte $gt $gte $eq $ne $in $nin
逻辑 $and $or $not $nor
数组 $all $size
其他 $exists $type $mod
查找函数 : limit() skip() sort() count() pretty()

其他函数 distinct() getCollection()


删除 remove(query,justOne)

=======================================
修改数据
update tableName set ... where .....

db.collectionName.update(query,update,upsert,multi)
功能 : 修改一个文档
参数 : query : 删选要修改的文档 相当于where子句
用法同查找
update : 将数据更新为什么内容 相当于set操作
需要使用修改器操作符
upsert : bool值 默认为false 表示如果query的文档不 存在则无法修改
如果设置为true 表示如果query的文档不存在则根据query和update参数插入新的文档
multi : bool值 默认为false 如果有多条符合筛选条件 的文档则只修改第一条
如果设置为true 则修改所有符合条件的文档

e.g. 将阿红年龄改为24
db.class0.update({name:'阿红'},{$set:{age:24}})

e.g. 如果筛选数据不存在则插入一个新的文档
db.class0.update({name:'阿花'},{$set:{age:18,sex:'w'}},true)

e.g. 可以同时修改多条匹配到的文档
db.class0.update({sex:'w'},{$set:{age:20}},false,true)


修改器操作符

$set
修改一个域的值
增加一个域
e.g. db.class0.update({name:'阿红'},{$set:{sex:'w'}})

$unset
删除一个域

e.g. 删除文档的sex和age域 (后面数字习惯写1,0 都表示删除)
db.class0.update({name:'八戒'},{$unset:{sex:0,age:0}})

$rename
修改一个域的名称

e.g. 修改所有的sex域为gender
db.class0.update({},{$rename:{sex:'gender'}},false,true)

$setOnInsert
如果update操作插入新的文档,则补充插入内容

e.g. 如果插入数据则同时插入sex和tel域内容
db.class0.update({name:'阿华'},{$set:{age:21},$setOnInsert:{sex:'m',tel:'123456'}},true)

$inc
加减修改器

e.g. 年龄减2
db.class0.update({age:{$lt:18}},{$inc:{age:-2}},false,true)
* $inc 可加正数 负数 小数都可以

$mul
乘法修改器
e.g.
db.class0.update({name:'阿华'},{$mul:{age:-0.5}})
* $mul 可乘以正数 负数 小数都可以

$min
设定最小值 : 如果筛选的文档指定的域值小于min值则不修改,如果大于min值则改为min值

e.g.
db.class0.update({},{$min:{age:19}},false,true)

$max
设置最大值 : 如果筛选的文档指定至于大于max值则不变,如果小于max值则修改为max值

e.g.
db.class0.update({},{$max:{age:20}},false,true)


数组修改器
$push 向数组中添加一项

e.g.
db.class1.update({name:"Abby"},{$push:{score:30}})

$pushAll 向数组中添加多项

e.g.
db.class1.update({name:"Jame"},{$pushAll:{score:[10,20]}})

$each 逐个操作

e.g. 利用each添加多项
db.class1.update({name:"Lily"},{$push:{score:{$each:[10,5]}}})

$position
选择数据位置进行操作 必须和each合用
e.g.

db.class1.update({name:"Lucy"},{$push:{score:{$each:[10,10],$position:1}}})

$sort
对数组进行排序 必须和each合用

e.g.
db.class1.update({name:"Lily"},{$push:{score:{$each:[],$sort:1}}})

$pull 从数组中删除一个元素

e.g.
db.class1.update({name:'Lucy'},{$pull:{score:10}})

$pullAll 从数组中删除多个元素

e.g.
db.class1.update({name:'Jame'},{$pullAll:{score:[10,20]}})

$pop 弹出数组中的一项

e.g.
db.class1.update({name:'Lily'},{$pop:{score:-1}})
* -1表示弹出数组中的第一项 1 表示弹出最后一项

$addToSet 向数组中插入一个元素,但是该元素不能和其他元素重复

e.g. 如果已经存在66则无法插入,如果不存在则插入66
db.class1.update({name:'Lily'},{$addToSet:{score:66}})

数据类型补充

时间类型
mongo中存储时间的格式 :ISODate

方法1 自动生成当前时间
db.class2.insert({title:'Python入门',date:new Date()})

方法2 生成当前时间
db.class2.insert({title:'Python精通',date:ISODate()})

方法3 将生成时间变为字符串存储
db.class2.insert({title:'Python AI',date:Date()})

指定时间的转换
ISOData()
功能 : 生成mongo时间类型
参数 : 如果不加参数则生成当前时间
参数格式 "2018-11-11 11:11:11"
"20180101 11:11:11"
"20181102"

e.g.
db.class2.insert({title:'Python 爬虫',date:ISODate("20180101 11:11:11")})

时间戳获取

e.g.
db.class2.insert({title:'PythonWeb',date:ISODate().valueOf()})


null

1. 如果某个域存在却没有值可以设置为null
e.g. db.class2.insert({title:'Python 秘籍',price:null})

2.表示某个域不存在可以通过null进行匹配
e.g. db.class2.find({date:null},{_id:0})
可以查找到date不存在的文档

Object类型 (值是一个文档)

*当使用外层文档引用内部文档的时候可以用用 . 的方法引用
在使用时需要加上引号
e.g.
db.class2.find({'publication.publisher':'人民教育'},{_id:0})

e.g.
db.class2.update({title:'Python数据'},{$set:{'publication.price':58.8}})


数组的下标引用

使用一个数组时,可以使用 .序列下标 的方式使用数组具体的某一项。同样需要用引号

e.g. db.class1.update({name:'Lily'},{$set:{'score.0':60}})
e.g. db.class1.find({'score.0':{$gt:90}})

文档查找结果的有序性

可以通过[]取查找结果序列的某一项
db.class1.find({},{_id:0})[1]

练习 :
使用之前的grade数据库
1. 将小红的年龄变为8岁 兴趣爱好变为 跳舞 画画
{$set:{age:8,hobby:['dance','draw']}}
2. 追加小明兴趣爱好 唱歌
{$push:{hobby:'sing'}}
3. 小王兴趣爱好增加 吹牛 打篮球
{$pushAll:{hobby:['吹牛','basketball']}}
4. 小李增加爱好,跑步和唱歌,但是不要和以前的重复
{$addToSet:{hobby:{$each:['running','sing']}}}
5. 该班所有同学年龄加1
update({},{$inc:{age:1}},false,true)
6. 删除小明的sex属性
{$unset:{sex:0}}
7. 删除小李兴趣中的第一项
{$pop:{hobby:-1}}
8. 将小红兴趣中的画画爱好删除
{$pull:{hobby:'draw'}}


索引

指的是建立指定键值及所在文档中存储位置的对照清单。使用索引可以方便我们进行快速查找,减少遍历次数,提高查找效率

mongo中如何创建索引

ensureIndex()
功能 : 创建索引
参数 : 索引类别,索引选项

e.g.
db.class0.ensureIndex({'name':1})

* 1表示为该域创建正向索引,-1 表示逆向索引
* _id 域会自动创建索引

查看一个集合中的索引
db.class0.getIndexes()

删除索引
dropIndex()
功能 : 删除索引
参数 : 删除索引的名称

e.g. 可以通过索引名称或者索引键值对删除
db.class0.dropIndex('name_1')
db.class0.dropIndex({name:1})

dropIndexes()
功能 : 删除所有索引

e.g. db.class0.dropIndexes()

索引类型

复合索引

根据多个域创建一个索引
db.class0.ensureIndex({name:1,age:-1})

数组索引
如果对某个数组域创建索引,那么表示对数组中的每个值均创建了索引,通过数组中单个值查询,也是索引查询
db.class1.ensureIndex({'score':1})

子文档索引
如果对一个域创建索引,值是一个文档则子文档也会同时形成索引

如果对子文档某一个域进行索引创建,则只有通过子文档中的该域查找时为索引查找

e.g.
db.class2.ensureIndex({'publication.pulisher':1})


覆盖索引
查找时只获取索引项的内容,而不必去获取原数据中的其他内容,这样就不去连接原来的数据直接返回即可

e.g. name为索引项,显示也只要name域
db.class0.find({name:'Lily'},{_id:0,name:1})

唯一索引

创建索引时希望索引域的值均不相同,也可以据此限制一个域的值

e.g.
db.class0.ensureIndex({name:1},{'unique':true})

*当对某个域创建了唯一索引后,即不允许在插入相同的值的文档

稀疏索引(间隙索引)
只针对有指定域的文档创建索引表,没有该域的文档,不会插入到索引表中

e.g.
db.class2.ensureIndex({'date':1},{sparse:true})

索引约束 :
1.影响数据的插入,删除,修改操作。当数据发生改变时,索引表必须同步更新
2.索引也是需要占用一定的空间资源

综上 : 当数据库大量的操作是插入,修改,删除操作,而非查询操作时,不适合创建索引。数据量比较小时,考虑到空间成本也不适合创建索引。即使适合创建索引的情况,也不是索引越多越好。


聚合

多数据文档进行整理统计

db.collectionName.aggregate()
功能 : 聚合函数,配合聚合条件进行数据整理统计
参数 : 聚合条件

聚合操作符

$group 分组 和分组操作符配合使用确定按什么分组
++++++++++++++++++++++++++++++++++
分组操作符 (和$group配合)

$sum 求和

统计每组个数
db.class0.aggregate({$group:{_id:'$gender',num:{$sum:1}}})
聚合 分组 按gender分组 统计结果名

统计每组年龄和
db.class0.aggregate({$group:{_id:'$gender',num:{$sum:'$age'}}})

$avg 求平均数

求平均年龄
db.class0.aggregate({$group:{_id:'$gender',num:{$avg:'$age'}}})

$min 求最小值

求每组姓名的最小值
db.class0.aggregate({$group:{_id:'$gender',name:{$min:'$name'}}})

$max
求每组姓名的最大值
db.class0.aggregate({$group:{_id:'$gender',name:{$max:'$name'}}})

$first
返回每组第一个文档指定域值
db.class0.aggregate({$group:{_id:'$gender',name:{$first:'$name'}}})

$last
返回每组最后一个文档指定域值
db.class0.aggregate({$group:{_id:'$gender',name:{$last:'$name'}}})
+++++++++++++++++++++++++++++++++++

$project
用于修饰文档的显示结构

e.g.
db.class0.aggregate({$project:{_id:0,name:1,age:1}})
e.g.
db.class0.aggregate({$project:{_id:0,Name:'$name',Age:'$age'}})

$match 过滤数据
操作符的值同find的query
db.class0.aggregate({$match:{name:{$gt:'Tom'}}})

$skip 跳过前几条文档
db.class0.aggregate({$skip:2})

$limit 显示几条文档
db.class0.aggregate({$limit:2})

$sort 排序
db.class0.aggregate({$sort:{name:1}})

聚合管道
将前一个聚合操作的结果给下一个聚合操作继续执行
db.collectionName.aggregate([聚合1,聚合2,.....])

e.g. match---> project ---> sort
db.class0.aggregate([{$match:{name:{$gt:'Tom'}}},{$project:{_id:0,name:1,age:1}},{$sort:{name:-1}}])

e.g. group ---> match
db.class0.aggregate([{$group:{_id:'$gender',num:{$sum:1}}},{$match:{$nor:[{_id:'m'},{_id:'w'}]}}])


作业练习 :
使用之前的grade数据库
增加分数域 score:{'chinese':88,'english':78,'math':98}
1. 按照性别分组统计每组人数
aggregate({$group:{_id:'$sex',num:{$sum:1}}})

2. 按照姓名分组,过滤出有重名的同学
aggregate([{$group:{_id:'$name',num:{$sum:1}}},{$match:{num:{$gt:1}}}])

3. 统计每名男生的语文成绩
aggregate([{$match:{sex:'m'}},{$project:{_id:0,name:1,'score.chinese':1}}])

4. 将女生按照英语分数降序排列
aggregate([{$match:{sex:'w'}},{$sort:{'score.english':-1}}])
******************************************************
第四天

修改
update(query,update,upsert,multi)

修改器 : $set $unset $rename $setOnInsert $inc $mul
$min $max
$push $pushAll $each $pull $pullAll $position
$pop $addToSet $sort

数据类型 Date() ISODate() valueOf()
null 的使用
Object :通过 . 取内部文档
通过 . 取数组索引

索引创建 ensureIndex()
聚合操作 aggregate()
聚合操作符 $group $match $project $limit $skip $sort
========================================================

固定集合

mongo中可以创建大小固定的集合,称之为固定集合,固定集合的性能出色,适用于很多场景
比如 : 日志处理, 临时缓存

特点 : 插入速度快
顺序查询速度快
能够淘汰早期数据
可以控制集合空间

创建:
db.createCollection(collectionName,{capped:true,size:10000,max:1000})

size :设置固定集合的大小 kb
max : 最多能容纳多少文档

e.g.
创建一个最多包含三条文档的集合
db.createCollection('log',{capped:true,size:10,max:3})


文件存储

数据库存储文件的方式
1. 在数据库中以字符串的方式存储文件在本地的路径

优点 : 节省数据库空间
缺点 : 当数据库或者文件位置发生变化即需要相应修改数据库内容

2. 将文件已二进制数据的方式存放在数据库里

优点:文件存入数据库,数据库在,文件即不会丢失
缺点: 当文件较大时,数据库空间占用大,提取困难

mongo中 使用GridFS方法 大文件存储

GridFS : 是mongodb中大文件存储的一种方案,mongo中认为大于 16M的文件为大文件

方案解释:
在mongodb数据库中 创建两个集合 共同完成对文件的存储
fs.files : 存储文件的相关信息,比如:文件名 文件类型
fs.chunks : 实际存储文件内容,以二进制方式分块存储。将大文件分为多个小块,每块占一个空间


mongofiles -d dbname put file
数据库 要存储的文件
*如果数据库不存在则自动创建

fs.files
{ "_id" : ObjectId("5b0770c169d72e1e3a6eebda"), "chunkSize" : 261120, "uploadDate" : ISODate("2018-05-25T02:11:13.986Z"), "length" : 8313457, "md5" : "4b39deb86dcb6ece44ef52a69dcd6e1a", "filename" : "xly.zip" }

fs.chunks
{ "_id" : ObjectId("5b0770c169d72e1e3a6eebee"), "files_id" : ObjectId("5b0770c169d72e1e3a6eebda"), "n" : 19, "data" : BinData(0,"wGTrj3......)}


获取数据库中文件
mongofiles -d grid get xly.zip

优缺点 :
优点 : 存储方便,方便数据库移植,对文件个数没有太多限制
缺点 : 读写效率低


游标

为什么使用游标
1. 防止网络拥塞,造成数据传输慢
2. 提高用户解析体验,可以后端解析

var cursor = db.class0.find() 创建游标
cursor.hasNext() 查看是否有下一个数据
cursor.next() 获取下一个数据

通过Python 操作mongodb数据库

Python ---》 mongodb编程接口 pymongo

安装
sudo pip3 install pymongo

操作步骤
1. 创建mongo数据库的链接对象
conn = MongoClient('localhost',27017)
2. 生成数据库对象
db = conn.stu
3. 生成集合对象
my_set = db.class0
4. 增删改差索引聚合操作


插入数据 insert() insert_many() insert_one()
save()

删除数据
remove({},multi = True)
multi 默认为True 表示删除所有符合条件的数据
设置为False 表示只删除一条

数据查找
find()
功能 : 查找数据库内容
参数 : 同 mongo shell find()
返回值 : 返回一个游标 ---》 迭代器

cursor 可迭代对象属性函数

next()
count()
limit()
skip()

sort()
mongoshell ---> sort({'name':1})
pymongo ---> sort([('name',1)])
* 进行排序时游标要确保没有被访问过

find_one()
返回值是一个字典

修改操作

update()
参数和mongoshell 中 update相同

update_many() :匹配到多个文档时全部修改

update_one() : 只修改匹配到的第一条文档

* 变成中mongo的数据类型null 可以用Python中的 None替代

索引
创建索引
ensure_index()
create_index()
create_indexes() 创建多个索引

查看集合中的索引
list_indexes()

删除索引
drop_index() 删除某一个索引
drop_indexes() 删除所有索引

聚合操作
aggregate([])
参数 : 与mongoshell中聚合参数写法一致
返回值 : 迭代器 同find的返回值
posted on 2018-05-31 22:06  wcleonard  阅读(747)  评论(0编辑  收藏  举报