pymongo:Python下 MongoDB 的存储操作

1.连接mongodb

#########  方法一  ##########
import pymongo
# MongoClient()返回一个mongodb的连接对象client
client = pymongo.MongoClient(host="localhost",port=27017)

#########  方法二  ##########
import pymongo
# MongoClient的第一个参数host还可以直接传MongoDB的连接字符串,以mongodb开头
client = pymongo.MongoClient(host="mongodb://127.0.0.1:27017/")

2.指定数据库

######  方法一  ######
# 指定test数据库
db = client.test

######  方法二  ######
# 指定test数据库(调用client的test属性即可返回test数据库)
db = client["test"]

3.指定集合

######  方法一  ######
# 指定student集合
collection = db.student

######  方法二  ######
# 指定student集合
collection = db["student"]

4.插入数据

  • db.collection.insert()
    可以插入一条数据(dict),也可以插入多条数据(list),返回‘_id’或‘_id’的集合
###### 插入一条数据 ######
student = {
 'name': 'Jordan',
 'age': 18,
 'gender': 'man'
}

result = db.collection.insert(student)
# insert()返回执行后文档的主键'_id'的值
print(result)  # 5932a68615c2606814c91f3d

######  插入多条数据  ######
student1 = {
 'name': 'Jordan',
 'age': 10,
 'gender': 'man'
}

student2 = {
 'name': 'Mike',
 'age': 11,
 'gender': 'man'
}

result = collection.insert([student1,student2])
# insert()返回执行后文档的主键'_id'的集合
print(result)  #[ObjectId('5932a80115c2606a59e8a048'), ObjectId('5932a80115c2606a59e8a049')]

pymongo 3.x版本中,insert()方法官方已不推荐使用,推荐使用insert_one()insert_many()将插入单条和多条记录分开。

  • db.collection.insert_one()
    用于插入单条记录,返回的是InsertOneResult对象
student = {
 'name': 'Jordan',
 'age': 18,
 'gender': 'man'
}

result = collection.insert_one(student)
# insert_one()返回的是InsertOneResult对象,我们可以调用其inserted_id属性获取_id。
print(result)  # <pymongo.results.InsertOneResult object at 0x10d68b558>
print(result.inserted_id) # 5932ab0f15c2606f0c1cf6c5
  • db.collection.insert_many()
    用于插入多条记录,返回的是InsertManyResult对象

student1 = {
 'name': 'Jordan',
 'age': 10,
 'gender': 'man'
}

student2 = {
 'name': 'Mike',
 'age': 11,
 'gender': 'man'
}

result = collection.insert_many([student1, student2])
# insert_many()方法返回的类型是InsertManyResult,调用inserted_ids属性可以获取插入数据的_id列表
print(result)  # <pymongo.results.InsertManyResult object at 0x101dea558>
print(result.inserted_ids) # [ObjectId('5932abf415c2607083d3b2ac'), ObjectId('5932abf415c2607083d3b2ad')]

5.查询数据:find_one()、find()

  • db.collection.find_one()
    查询返回单个结果(dict或者None)
result = db.collection.find_one({"name": "Mike"})
print(result) #{'_id': ObjectId('5932a80115c2606a59e8a049'),'name': 'Mike', 'age': 21, 'gende' :'man'}
  • db.collection.find()
    查询返回多个结果(cursor类型,可迭代)。
results = collection.find({"age":18})
print(results) # <pymongo.cursor.Cursor object at 0x1032d5128>
for result in results:
      print(result)
#

如果要查询年龄大于 20 的数据,则写法如下:

results = collection.find({'age': {'$gt': 20}})

比较符号:

符  号 含  义 示  例
$lt 小于 {'age': {'$lt': 20}}
$gt 大于 {'age': {'$gt': 20}}
$lte 小于等于 {'age': {'$lte': 20}}
$gte 大于等于 {'age': {'$gte': 20}}
$ne 不等于 {'age': {'$ne': 20}}
$in 在范围内 {'age': {'$in': [20, 23]}}
$nin 不在范围内 {'age': {'$nin': [20, 23]}}

另外,还可以进行正则匹配查询。例如,查询名字以 M 开头的学生数据,示例如下:

results = collection.find({'name': {'$regex': '^M.*'}})

这里使用 $regex 来指定正则匹配,^M.* 代表以 M 开头的正则表达式。

这里将一些功能符号再归类为下表。

符  号 含  义 示  例 示例含义
$regex 匹配正则表达式 {'name': {'$regex': '^M.*'}} name
以 M 开头
$exists 属性是否存在 {'name': {'$exists': True}} name
属性存在
$type 类型判断 {'age': {'$type': 'int'}} age
的类型为 int
$mod 数字模操作 {'age': {'$mod': [5, 0]}} 年龄模 5 余 0
$text 文本查询 {'$text': {'$search': 'Mike'}} text
类型的属性中包含 Mike
字符串
$where 高级条件查询 {'$where': 'obj.fans_count == obj.follows_count'} 自身粉丝数等于关注数

关于这些操作的更详细用法,可以在 MongoDB 官方文档找到: https://docs.mongodb.com/manual/reference/operator/query/

  • 多条件查询 **$and** **$or**
# and查询
db.collection.find({
         $and :  [
                { "age" :  {$gt : 10 }} ,
                { "gender" :  "man" }
          ]
})

#or查询
db.collection.find({
          $or : [
                    {"age" :  {$gt : 10 }},
                    { "gender" :  "man"}
         ]
})

#and查询 和 or查询
db.inventory.find( {
    $and : [
        { $or : [ { price : 0.99 }, { price : 1.99 } ] },
        { $or : [ { sale : true }, { qty : { $lt : 20 } } ] }
    ]
} )
  • count()
    计数,对查询结果进行个数统计
count = collection.find().count()
print(count)
  • 排序 **sort()**
    调用sort方法,传入要排序的字段and升降序标志即可
#单列升序排列
results = db.collection.find().sort('name', pymongo.ASCENDING) # 升序(默认)
print([result['name'] for result in results])

# 单列降序排列
results = db.collection.find().sort("name",pymongo.DESCENDING)  #降序
print([result['name'] for result in results])

#多列排序
results = db.collection.find().sort([
  ("name", pymongo.ASCENDING),("age", pymongo.DESCENDING)
])
  • 偏移 **skip()**
results = collection.find().sort('name', pymongo.ASCENDING).skip(2)
print([result['name'] for result in results])

注意:在数据量非常庞大时(千万、亿级别),最好不要用skip()来查询数据,可能导致内存溢出。可以使用
find({'_id': {'$gt': ObjectId('593278c815c2602678bb2b8d')}})
这样的方法来查询。

  • 限制 **limit()**
results = collection.find().sort('name', pymongo.ASCENDING).skip(2).limit(2)
print([result['name'] for result in results])

6.更新数据

  • db.collection.update()
    修改单条或者多条文档,已不推荐此用法
result = collection.update(
            {"age": {"$lt" : 15}} ,
            {"$set" : {"gender" : "woman"}}
)

print(result)  # {'ok': 1, 'nModified': 1, 'n': 1, 'updatedExisting': True}
  • db.collection.update_one()
    修改单条文档,返回结果是UpdateResult类型

针对UpdateResult类型数据,可以调用matched_count和modified_count属性分别获取匹配的条数和影响的条数

result = db.collection.update_one(
              {"name" : "Mike"} ,
              {
                "$inc" : {"age" : 5},
                "$set": {"gender": "male"}
              }
)

print(result)   # <pymongo.results.UpdateResult object at 0x10d17b678>

print(result.matched_count, result.modified_count)   # 1  1
  • db.collection.update_many()
    修改多条文档,返回结果是UpdateResult类型
result = db.collection.update_many(
              {"name" : "Mike"} ,
              {"$inc" : {"age" : 5}}
)

print(result)   # <pymongo.results.UpdateResult object at 0x10c6384c8>

print(result.matched_count, result.modified_count)   # 3   3

7.删除数据

  • db.collection.remove()
    删除指定条件的所有数据
result = db.collection.remove({"age" : {"$gte" : 10}})

print(result)  # {'ok': 3, 'n': 3}
  • db.collection.delete_one()
    删除第一条符合条件的数据,返回DeleteResult类型数据
result = collection.delete_one({'name': 'Kevin'})
print(result) # <pymongo.results.DeleteResult object at 0x10e6ba4c8>
print(result.deleted_count)  # 1
  • db.collection.delete_many()
    删除所有符合条件的数据,返回DeleteResult类型数据
result = collection.delete_many({'name': 'Kevin'})
print(result) # <pymongo.results.DeleteResult object at 0x55e6be5f1>
print(result.deleted_count)  # 4

其他

另外,pymongo还提供了更多方法,如find_one_and_delete() find_one_and_replace() find_one_and_update()
当然,还有操作索引的方法:create_index() create_indexes() drop_index()等。

import pymongo

client = pymongo.MongoClient(host="127.0.0.1", port="27017")

db = client["test"]
coll = db["myindex"]

# 在后台创建唯一索引
coll.create_index([(x,1)], unique = True, background = True,name = "x_1")

# 查看集合coll的所有索引信息
result = coll.index_information()
print(result)

# 在后台创建复合索引
db.myindex.create_index([("x", 1), ("y", 1)])

# 删除索引
coll.drop_index([("x", 1)])
# coll.drop_index("x_1")

详细用法可以参见官方文档:http://api.mongodb.com/python/current/api/pymongo/collection.html

另外还有对数据库、集合本身以及其他的一些操作,在这不再一一讲解,可以参见官方文档:http://api.mongodb.com/python/current/api/pymongo/

posted @ 2024-05-09 14:37  luckzack  阅读(95)  评论(0编辑  收藏  举报