python 操作MongoDB

安装MongoDB

启动数据库：安装完成指定数据库存放路径 mongod.exe --dbpath c:\data\db
进入目录后运行mongo.exe 成功

创建数据库

> use mydb
switched to db mydb
> db
mydb

> book = {"title":"from beginner to master", "author":"qiwsir", "lang":"python"}
{
    "title" : "from beginner to master",
    "author" : "qiwsir",
    "lang" : "python"
}
> db.books.insert(book)
> db.books.find()
{ "_id" : ObjectId("554f0e3cf579bc0767db9edf"), "title" : "from beginner to master", "author" : "qiwsir", "lang" : "Python" }

db 指向了数据库 mydb，books 是这个数据库里面的一个集合（类似 mysql 里面的表），向集合 books 里面插入了一个文档（文档对应 mysql 里面的记录）。“数据库、集合、文档”构成了 mongodb 数据库。

用到数据库，就通过 use xxx，如果不存在就建立；用到集合，就通过 db.xxx 来使用，如果没有就建立。可以总结为“随用随取随建立”。

投影

在查询到的返回结果中，只选择必要的字段，而不是选择一个文档的整个字段
如：一个文档有5个字段，需要显示只有3个，投影其中3个字段即可
语法：
参数为字段与值，值为1表示显示，值为0不显示

db.集合名称.find({},{字段名称:1,...})

对于需要显示的字段，设置为1即可，不设置即为不显示
特殊：对于_id列默认是显示的，如果不显示需要明确设置为0
例1

db.stu.find({},{name:1,gender:1})

例2

db.stu.find({},{_id:0,name:1,gender:1})

排序

方法sort()，用于对结果集进行排序
语法

db.集合名称.find().sort({字段:1,...})

参数1为升序排列
参数-1为降序排列
例1：根据性别降序，再根据年龄升序

db.stu.find().sort({gender:-1,age:1})

消除重复

方法distinct()对数据进行去重
语法

db.集合名称.distinct('去重字段',{条件})

例1:查找年龄大于18的性别（去重）

db.stu.distinct('gender',{age:{$gt:18}})

安装 Pymongo

pip install Pymongo

>>> import Pymongo
>>> client = pymongo.MongoClient("localhost", 27017)

刚才已经建立了一个数据库 mydb，并且在这个库里面有一个集合 books，于是：

>>> db = client.mydb

或者

>>> db = client['mydb']

获得数据库 mydb，并赋值给变量 db（这个变量不是 mongodb 的 shell 中的那个 db，此处的 db 就是 Python 中一个寻常的变量）。

>>> db.collection_names()
[u'system.indexes', u'books']

查看集合，发现了我们已经建立好的那个 books，于是在获取这个集合，并赋值给一个变量 books：

>>> books = db["books"]  或者 >>> books = db.books

增删改查

>>> books.find_one()
{u'lang': u'Python', u'_id': ObjectId('554f0e3cf579bc0767db9edf'), u'author': u'qiwsir', u'title': u'from beginner to master'}

在 mongodb 的 shell 中是这样子的：

> db.books.findOne()
{
    "_id" : ObjectId("554f0e3cf579bc0767db9edf"),
    "title" : "from beginner to master",
    "author" : "qiwsir",
    "lang" : "python"
}

新增和查询

>>> b2 = {"title":"physics", "author":"Newton", "lang":"english"}
>>> books.insert(b2)
ObjectId('554f28f465db941152e6df8b')

>>> books.find().count()
2

>>> for i in books.find():
...     print i
... 
{u'lang': u'Python', u'_id': ObjectId('554f0e3cf579bc0767db9edf'), u'author': u'qiwsir', u'title': u'from beginner to master'}
{u'lang': u'english', u'title': u'physics', u'_id': ObjectId('554f28f465db941152e6df8b'), u'author': u'Newton'}

批量插入

>>> n1 = {"title":"java", "name":"Bush"}
>>> n2 = {"title":"fortran", "name":"John Warner Backus"}
>>> n3 = {"title":"lisp", "name":"John McCarthy"}
>>> n = [n1, n2, n3]
>>> n
[{'name': 'Bush', 'title': 'java'}, {'name': 'John Warner Backus', 'title': 'fortran'}, {'name': 'John McCarthy', 'title': 'lisp'}]
>>> books.insert(n)
[ObjectId('554f30be65db941152e6df8d'), ObjectId('554f30be65db941152e6df8e'), ObjectId('554f30be65db941152e6df8f')]

按条件查询

>>> books.find_one({"name":"Bush"})
{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'}

对于查询结果，还可以进行排序：

>>> for i in books.find().sort("title", pymongo.ASCENDING):
...     print i
... 
{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': u'Hertz'}
{u'_id': ObjectId('554f30be65db941152e6df8e'), u'name': u'John Warner Backus', u'title': u'fortran'}
{u'lang': u'python', u'_id': ObjectId('554f0e3cf579bc0767db9edf'), u'author': u'qiwsir', u'title': u'from beginner to master'}
{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'}
{u'_id': ObjectId('554f30be65db941152e6df8f'), u'name': u'John McCarthy', u'title': u'lisp'}
{u'lang': u'english', u'title': u'physics', u'_id': ObjectId('554f28f465db941152e6df8b'), u'author': u'Newton'}

这是按照"title"的值的升序排列的，注意 sort() 中的第二个参数，意思是升序排列。如果按照降序，就需要将参数修改为Pymongo.DESCEDING，也可以指定多个排序键。

更新数据

对于已有数据，进行更新，是数据库中常用的操作。比如，要更新 name 为 Hertz 那个文档：

在更新的时候，用了一个 $set 修改器，它可以用来指定键值，如果键不存在，就会创建。

>>> books.update({"name":"Hertz"}, {"$set": {"title":"new physics", "author":"Hertz"}})
{u'updatedExisting': True, u'connectionId': 4, u'ok': 1.0, u'err': None, u'n': 1}
>>> books.find_one({"author":"Hertz"})
{u'title': u'new physics', u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': u'Hertz', u'author': u'Hertz'}

关于修改器，不仅仅是这一个，还有别的呢。

删除

删除可以用 remove() 方法：

>>> books.remove({"name":"Bush"})
{u'connectionId': 4, u'ok': 1.0, u'err': None, u'n': 1}
>>> books.find_one({"name":"Bush"})
>>>

也可以根据 mongodb 的语法规则，写个条件，按照条件删除。

索引

索引的目的是为了让查询速度更快，当然，在具体的项目开发中，要视情况而定是否建立索引。因为建立索引也是有代价的。

>>> books.create_index([("title", pymongo.DESCENDING),])
u'title_-1'

数据导出CSV

在用mongoexport导出csv文件时，发现数据库中的中文在excel中都显示为乱码，用notepad打开则正常。

解决办法：在notepad中，将编码格式改为UTF-8，保存，再用excel打开，则中文可正常显示。

posted @ 2017-06-13 19:44 Erick-LONG 阅读(517) 评论(0) 收藏举报

刷新页面返回顶部

Erick - LONG

Be Patient! Be Positive! Be Persistence!

python 操作MongoDB

投影

排序

消除重复

公告