MongoDB day04

文件存储

文件存储到数据库的方式

1. 存储路径

将文件在本地的路径以字符串形式存储到数据库

优点 : 节省数据库空间

缺点 : 当数据库或者文件位置发生变化时文件丢失。

2. 存储文件本身

以二进制方式将文件存储到数据库

优点:数据库和文件绑定存在

缺点 : 占用数据库空间大,存储效率低,结构化麻烦

mongodb存储二进制文件

 

* 大文件用GridFS方法存储  >16M为大文件

* 将小文件文件转化为二进制,将文件存储到数据库

GridFS方案解释

1. 在mongodb中一个数据库创建两个集合配合完成对文件的存储

2. fs.files 用来存储文件的相关信息,为每一个文件创建一个文档,存储文件名、文件类型等信息、存入时间

3. fs.chunks 用来分块存储文件(Binery data类型数据)的实际内容

存储方式

mongofiles  -d  dbname   put   file

         数据库       要存储的文件

* 如果数据库不存在自动创建;数据库总会自动创建fs.files  fs.chunks两个集合

fs.files文档结构

{ "_id" : ObjectId("5b569b8969d72e103282f608"), "chunkSize" : 261120, "uploadDate" : ISODate("2018-07-24T03:22:54.259Z"), "length" : 247759369, "md5" : "a94853f4f64b3e87bf98aea770855615", "filename" : "abc.mp4" }

fs.chunks的文档结构

{ "_id" : ObjectId("5b569b8969d72e103282f61d"), "files_id" : ObjectId("5b569b8969d72e103282f608"), "n" : 20, "data" : BinData(0,"7Pa7M7M9nZt2bezsz272vbdm/7fhu672fwAAbZKbmR2S7Ndv/.....")}

* 对于同一个文件 fs.files中的_id值等于 fs.chunks中的files_id值

文件提取方法  mongofiles  -d  dbname  get  file

Grid的优缺点

优点 : 存储方便,提供较好的命令支持

缺点 : 读写效率低

游标

通过一定的操作获取返回的对象

var cursor = db.class1.find()

cursor.hasNext()  判断是否有next

cursor.next()  获取下一条数据

python操作mongodb 

pymongo模块   第三方模块

安装

sudo pip3 install pymongo

操作步骤

1、创建monggodb数据库连接对象

conn = pymongo.MongoClient('localhost',27017)

2、得到数据库对象

db = conn.stu

3、获取集合对象

myset = db.class1

4、增删改查,索引,集合

调用各种myset的属性函数

5、关闭数据库连接

conn.close()

插入操作

insert()

insert_many()  insert_one()

查找操作

cursor = find()

功能:对数据库进行查找

参数:同mongoshel find()

返回值:返回游标对象

cursor属性函数

find_one()

返回一个结果游标

* 在pymongo中使用·操作符的方法与mongo shell中相同,只需要转变字符串格式加上引号即可

cursor的属性函数

next()

limit()

skip()

sort([('name',1),('age',-1)])

count()

* 使用了next或者for取游标后就不能使用limit sort操作了 

find_one()

返回一个字典

更新操作

update(query,updata,upsert=False,multi=False)

update_many()

update_one()

删除操作

remove(query,multi = True)

4通过循环遍历游标指定文件对象,read()读取文件内容写入本地

 

posted @ 2018-08-22 09:24  凌逆战  阅读(211)  评论(0编辑  收藏  举报