用Python操作MongoDB(pymongo)

MongoDB简介(摘自:http://www.runoob.com/mongodb/mongodb-intro.html

MongoDB 由C++语言编写,是一个基于分布式文件存储的开源数据库系统。

MongoDB 将数据存储为一个文档,数据结构由键值对(key=>value)组成,类似于 JSON 对象。

MongoDB 属于NoSQL,NoSQL即Not Only SQL,意思是"不仅仅是SQL",泛指非关系型数据库。

(关系数据库管理系统(RDBMS)与非关系型数据库(NoSQL)之间的区别请见:https://www.cnblogs.com/HuZihu/p/10233242.html

 

MongoDB的一些基本术语

SQL术语/概念MongoDB术语/概念解释/说明
database database 数据库
table collection 数据库表/集合
row document 数据记录行/文档
column field 数据字段/域
index index 索引
table joins   表连接,MongoDB不支持
primary key primary key 主键,MongoDB自动将_id字段设置为主键

 

使用Python操作MongoDB

接下来我们用python来操作MongDB,首先需要安装PyMongo库(pip install pymongo)。

 

连接MongoDB

import pymongo
client=pymongo.MongoClient(host='localhost',port=27017)

注:

host为指定的连接服务器的地址,设置为'localhost'代表连接到本地的MongoDB服务上

port为指定的端口,如果不填,默认为27017

 

查看MongoDB中的所有数据库

dblist=client.list_database_names()

结果显示现有3个数据库:

['admin', 'config', 'local']

 

创建或指定数据库

db=client['HuziHu']

(注:在MongoDB中,数据库只有在内容插入后才会创建)

 

创建或指定集合:(集合类似于关系型数据库中的表格)

collection=db['Xiaoyugan']

(注:在MongoDB中,集合只有在内容插入后才会创建)

 

查看指定数据库中的所有集合

collist=db.list_collection_names()

 

插入数据:(我们可以自行指定每条数据的id--"_id";如果我们在插入数据时没有指定 _id,那么MongoDB 会为每条数据添加一个唯一的id。)

插入单条数据:insert_one()

yugan={"Name":"Xiaoyugan", "Type":"001", "Flavor":"Spicy","Num":4,"Comment":"Don\'t like it.Too hot!"}
collection.insert_one(yugan)

注:insert_one()方法返回InsertOneResult对象,该对象包含 inserted_id 属性,它是插入数据的id值。

 

插入多条数据:insert_many()

yugan=[{"Name":"Xiaoyugan", "Type":"001", "Flavor":"Spicy","Num":4,"Comment":"Don\'t like it.Too hot!"},
       {"Name":"Xiaoyugan", "Type":"002", "Flavor":"Sweet","Num":2,"Comment":"Don\'t like it.Too sweet!"},
       {"Name":"Xiaoyugan", "Type":"004", "Flavor":"Fish","Num":16,"Comment":"liked it."}]
collection.insert_many(yugan)

注:insert_many()方法返回InsertManyResult对象,该对象包含 inserted_ids 属性,该属性保存着所有插入数据的id值。

 

查看数据的id值:xx.inserted_id(对于单条数据)

                            xx.inserted_ids(对于多条数据)

 

查看指定集合中的所有数据:

for i in collection.find():
    print(i)

 

查询数据:

查询单条数据:find_one(...)   ---返回符合查询条件的第一条结果,如果没有符合查询条件的结果,那么返回None

query={"Type":"004"}

print(collection.find_one(query))

结果:

{'_id': ObjectId('5c330ea47eb8d621f8d0a351'), 'Name': 'Xiaoyugan', 'Type': '004', 'Flavor': 'Fish', 'Num': 16, 'Comment': 'liked it.'}

 

查询所有数据:find(...)   ---返回符合查询条件的所有结果,如果没有符合查询条件的结果,那么返回None

query={"Type":"004"}

for i in collection.find(query):
    print(i)

结果:

{'_id': ObjectId('5c330ea47eb8d621f8d0a351'), 'Name': 'Xiaoyugan', 'Type': '004', 'Flavor': 'Fish', 'Num': 16, 'Comment': 'liked it.'}
{'_id': ObjectId('5c330f6e7eb8d621f8d0a355'), 'Name': 'Xiaoyugan', 'Type': '004', 'Flavor': 'Fish', 'Num': 16, 'Comment': 'liked it.'}
{'_id': ObjectId('5c330f857eb8d621f8d0a359'), 'Name': 'Xiaoyugan', 'Type': '004', 'Flavor': 'Fish', 'Num': 16, 'Comment': 'liked it.'}

 

查询条件可以使用修饰符:

符号

含义

语法

$lt

小于

{field: {'$lt': value} }

$gt

大于

{field: {'$gt': value} }

$lte

小于等于

{field: {'$lte': value} }

$gte

大于等于

{field: {'$gte': value} }

$ne

不等于

{field: {'$ne': value} }

$in

在范围内

{field: {'$in': [ <value1>, <value2> ... <valueN> ]} }

$nin

不在范围内

{ field: { '$nin': [ <value1>, <value2> ... <valueN> ]} }

$and

 { '$and': [ { <expression1> }, { <expression2> } , ... , { <expressionN> } ] }

$or

 或

 { '$or': [ { <expression1> }, { <expression2> }, ... , { <expressionN> } ] }

$not

 不是

 { field: { '$not': { <operator-expression> } } }

 

此外,查询还可以使用一些功能符号:

符号

含义

示例

示例含义

$regex

匹配正则表达式

{'name': {'$regex': '^M.*'}}

name以M开头

$exists

属性是否存在

{'name': {'$exists': True}}

name属性存在

$type

类型判断

{'age': {'$type': 'int'}}

age的类型为int

$mod

数字模操作

{'age': {'$mod': [5, 0]}}

年龄模5余0

$text

文本查询

{'$text': {'$search': 'Mike'}}

text类型的属性中包含Mike字符串

$expr

使用聚合表达式

{ '$expr': {'$gt':['$fans_count', '$follows_count']} }

粉丝数大于关注数

 

对查询条件更多的说明请见官方文档:https://docs.mongodb.com/manual/reference/operator/query/

 

限制返回查询结果的条数:limit(...)

query={"Comment":{"$regex":"^Don"}}

for i in collection.find(query).limit(2):
    print(i)

结果:

{'_id': ObjectId('5c330d667eb8d621f8d0a34d'), 'Name': 'Xiaoyugan', 'Type': '001', 'Flavor': 'Spicy', 'Num': 4, 'Comment': "Don't like it.Too hot!"}
{'_id': ObjectId('5c330ea47eb8d621f8d0a34f'), 'Name': 'Xiaoyugan', 'Type': '001', 'Flavor': 'Spicy', 'Num': 4, 'Comment': "Don't like it.Too hot!"}

 

统计查询结果的条数:count_documents(...)

query={"Type":"004"}

print(collection.count_documents(query))

 

对查询结果进行排序:sort(...)

for i in collection.find().sort('Num', pymongo.ASCENDING):
    print(i)

注:pymongo.ASCENDING为升序,pymongo.DESCENDING为降序。

 

更新数据:

更新单条数据: update_one(..., ...)   --- 修改符合查询条件的第一条数据

query={'Flavor': 'Spicy'}
newvalue={"Flavor":"Hot"}

collection.update_one(query,{'$set':newvalue})

 

更新多条数据: update_many(..., ...)   --- 修改符合查询条件的所有数据

query={}
newvalue={'Num':1}

collection.update_many(query,{'$inc': newvalue})

注:返回结果是UpdateResult类型,分别调用matched_countmodified_count属性,可以获得匹配的数据条数和影响的数据条数。

 

一些常用的更新操作符:

符号

含义

$rename

重新命名字典的键

$set

设置字典的值

$unset

去除字典的键

$inc

增加字典的值

$setOnInsert

对已有的数据不更新,只插入原本不存在的数据

 

删除数据:

删除单条数据: delete_one(...)   --- 删除符合查询条件的第一条数据

 

删除多条数据: delete_many(...)   --- 删除符合查询条件的所有数据

from bson.objectid import ObjectId

collection.delete_many({'_id':{'$gt':ObjectId('5c330f857eb8d621f8d0a359')}})

删除_id大于ObjectId('5c330f857eb8d621f8d0a359')的数据。

 

注:

删除数据返回的结果都是DeleteResult类型,可以调用deleted_count属性获取删除数据的条数。

delete_many() 方法如果传入的是一个空的查询对象,则会删除集合中所有的文档。

 

对集合重新命名: rename()

collection.rename('Yu')

 

删除集合:

collection.drop()

 

删除数据库:

client.drop_database('HuziHu')

 

对集合的更多操作可参见官方文档:http://api.mongodb.com/python/current/api/pymongo/collection.html

 

posted @ 2019-01-09 17:12  HuZihu  阅读(2013)  评论(0编辑  收藏  举报