Python 操作 MongoDB

Python 操作 MongoDB

1 MongoDB 简介

MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。

MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。

MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。

1.1 NoSQL的优点/缺点

优点:

  • 高可扩展性
  • 分布式计算
  • 低成本
  • 架构的灵活性,半结构化数据
  • 没有复杂的关系

缺点:

  • 没有标准化
  • 有限的查询功能(到目前为止)
  • 最终一致是不直观的程序

1.2 使用MongoDB注意事项

数据库也通过名字来标识。数据库名可以是满足以下条件的任意UTF-8字符串。

  • 不能是空字符串("")。
  • 不得含有' '(空格)、.、$、/、\和\0 (空字符)。
  • 应全部小写。
  • 最多64字节。

有一些数据库名是保留的,可以直接访问这些有特殊作用的数据库。

  • admin: 从权限的角度来看,这是"root"数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
  • local: 这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合
  • config: 当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。

1.3 MongoDB 数据类型

数据类型 描述
String 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。
Integer 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。
Boolean 布尔值。用于存储布尔值(真/假)。
Double 双精度浮点值。用于存储浮点值。
Min/Max keys 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。
Array 用于将数组或列表或多个值存储为一个键。
Timestamp 时间戳。记录文档修改或添加的具体时间。
Object 用于内嵌文档。
Null 用于创建空值。
Symbol 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。
Date 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。
Object ID 对象 ID。用于创建文档的 ID。
Binary Data 二进制数据。用于存储二进制数据。
Code 代码类型。用于在文档中存储 JavaScript 代码。
Regular expression 正则表达式类型。用于存储正则表达式。

2 MongoDB 命令

2.1 基础命令

show databases  # 查看本地磁盘中的数据库
use databasename  # 切换当前使用的数据库
db  # 查看当前使用的数据库 
show dbs  # 查看所有数据库
show tables  # 查看当前数据库磁盘中的表

# 创建数据库
use fcarey  # use 不存在的数据库名
# 刚创建的数据库 fcarey 并不在数据库的列表中, 要显示它,需要向 fcarey 数据库插入一些数据。

# 创建集合
db.members  # db.不存在的表名

# 插入数据
db.members.insertOne({name:'fcarey',age:18,hobby:[{name:'hobby01'},{name:'hobby02'},{name:'hobby03'}]})

# 删除集合
db.members.drop()

# 删除数据库
db.dropDatabase()
  • 注意: 在 MongoDB 中,集合只有在内容插入后才会创建! 就是说,创建集合(数据表)后要再插入一个文档(记录),集合才会真正创建。

2.2 集合的增删改查

2.2.1 增加

# 创建集合
db.members  # db.不存在的表名
db.createCollection('test')

# 查看已有集合
show tables
show collections

# 向集合插入一个数据:db.members.insertOne({})
db.members.insertOne({name:'fcarey',age:18,hobby:[{name:'hobby01'},{name:'hobby02'},{name:'hobby03'}]})

# 向集合插入多个数据:db.members.insertMany([{},{}])	
db.members.insertMany([
    {name:'fcarey',age:19,hobby:[{name:'hobby05'},{name:'hobby07'},{name:'hobby12'}]},
    {name:'user01',age:122,hobby:[{name:'hobby01'},{name:'hobby03'},{name:'hobby06'}]},
    ])

2.2.2 查询

# 逻辑顺序:sort > skip > limit
# 查看集合中的数据
db.members.find({})

# 查询所有符合条件的数据
db.members.find({name:'fcarey'})

# 查询符合条件的第一条数据
db.members.findOne({age:{$gt: 100}})
$数据比较符
$lt		小于
$lte	小于等于
$gt		大于
$gte	大于等于
$eq		等于
$ne		不等于
# $or
db.members.find({$or:[{name:'user01'},{name:'user03'}]})
# $and
db.members.find({$and:[{"hobby.name":'hobby01'},{"hobby.name":'hobby03'}]})

# 针对array
# $in
db.members.find({"hobby.name":{$in: ['hobby12']}})
# $all
db.members.find({"hobby.name":{$all: ['hobby05','hobby12']}})

# 排序
db.members.find({}).sort({ _id:1 })  # 正序
db.members.find({}).sort({ _id:-1 })  # 倒序

# 跳过
db.members.find({}).skip(2)  # 跳过2个条目

# 选取2条数据,若数据小于2,则全部查询,大于2,则只查询2条
db.members.find({}).skip(2).limit(2)

# 分页
count = 2
page = 1
skip = (page-1)*count
db.members.find({}).sort({_id:1}).skip(1*2).limit(2)

2.2.3 改

# $set更新符合条件的第一条数据
db.members.updateOne({name:'fcarey',age:19},{$set:{'age':80}})
# $set更新符合条件的所有数据
db.members.updateMany({name:'fcarey'},{$set: {age:15}})
# $set没有则创建
db.members.updateMany({name:'fcarey'},{$set: {gender:'男'}})
# $unset删除数据中的某个元素
db.members.updateOne({name:'fcarey'},{$unset: {gender: "男" }})
# 更新Array中的数据
db.members.updateOne({name:'fcarey',"hobby.name":'hobby05'},{$set:{"hobby.$.name":'吃水果'}})
db.members.updateOne({name:'fcarey','hobby':{name:'hobby05'}},{$set:{"hobby.$":{'name':'吃水果'}}})
# $是用来存储符合当前Array条件元素的下标索引
# 当前Array:[{name:'hobby05'},{name:'hobby07'},{name:'hobby12'}]
# 条件元素: 'hobby':{name:'hobby05'}
# 当前Array第一个符合条件,它的下表索引是 1,当前$ 的值就是 1


# $inc先引用原有数据,在原有数据基础上增加,正数时为增加,负数时为减少
db.members.updateOne({name:'fcarey'},{$inc: {age:1}})

# 针对 Array List操作
# $push:在Array类型中增加数据在最末端增加一条数据
db.members.updateOne({name:'fcarey'},{$push: {hobby:{name:'movies'}}})
# $push:在Array类型中增加数据在最末端增加多条数据
db.members.updateOne({name:'fcarey',age:{$eq: 15}},{$push: {hobby:{$each: [{name:'movie'},{name:'sport'}]}}})
# $pull删除所有符合条件的一条数据
db.members.updateOne({name:'fcarey',age:{$eq: 15}},{$pull: {hobby: {name:'movies'}}})
# $pull遍历删除所有符合条件的多条数据
db.members.updateOne({name:'fcarey',age:{$eq: 15}},{$pullAll: {hobby: [{name:'movie'},{name:'sport'}]}})
# 删除Array中第一条数据
db.members.updateOne({name:'fcarey',age:{$eq: 15}},{$pop: {hobby: -1}})
# 删除Array中最后一条数据
db.members.updateOne({name:'fcarey',age:{$eq: 15}},{$pop: {hobby: 1}})

2.2.4 删除

# 删除符合条件的第一条数据
db.members.deleteOne({name:'user01'})
# 删除所有符合条件的数据
db.members.deleteMany({name:'fcarey'})
# 条件为空时,删除所有数据
db.members.deleteMany({})

# 删除集合
db.members.drop()

# 删除数据库
db.dropDatabase()

3 python 操作 MongoDB

  • 安装:pip install pymongo
import json

from pymongo import MongoClient

mongo_client = MongoClient(host='127.0.0.1', port=27017)
db = mongo_client['fcareydb']
user_info = {
    'name': 'user01',
    'age': 18,
    'hobby': [
        {
            'name': 'hobby01',
            'weight': 8,
        },
        {
            'name': 'hobby02',
            'weight': 6,
        },
    ]
}

# 插入数据
res = db.users.insert_one(user_info)
print(res.inserted_id, type(res.inserted_id))
# <class 'bson.objectid.ObjectId'>不能被JSON序列化,但可以转成字符串

# 查询数据
res = db.users.find({})
for i in res:
    print(i)

res = db.users.find_one({'name': 'user01'})
print(res)
res['_id'] = str(res.get('_id'))  # Object of type ObjectId is not JSON serializable,需转换成str
res_json = json.dumps(res)
print(res_json)

# 更新数据 update
res = db.users.update_one({'name': 'fcarey'}, {'$set': {'name': 'user02'}})
print(res)
db.users.update_many({}, {'$inc': {'age': 10}})

# 删除数据
from bson.objectid import ObjectId

res = db.users.delete_one({'_id': ObjectId('641e72f432021d8683e88a23')})
print(res.deleted_count)
res = db.users.find({'_id': ObjectId('641e72ddc86ed1677c93c7a5')})
print(res[0])

# 排序 选取 跳过
from pymongo import ASCENDING, DESCENDING

res = db.users.find({}).limit(2).skip(1).sort('_id', ASCENDING)
for i in res:
    print(i)

# 删除array中某个属性
res = db.users.find_one({})
for i in res.get('hobby'):
    if i.get('name')=='hobby01':
        name = i
        res.get('hobby').remove(i)

# res['hobby_his'] = [name]
print(res)
posted @ 2023-04-09 14:22  f_carey  阅读(43)  评论(0编辑  收藏  举报