Python: Windows 7 64位 安装、使用 pymongo 3.2

官网tutorial:  http://api.mongodb.com/python/current/tutorial.html

本教程将要告诉你如何使用pymongo模块来操作MongoDB数据库。

一、先决条件
    开始之前,我们需要确定电脑已经安装了pymongo和MongoDB.
    1.安装pymongo
          使用pip安装pymongo,在cmd命令行输入:
               pip install pymongo
          在python IDLE 中输入:import pymongo 没有报错表示安装成功。
    2.安装MongoDB
         参考这个链接:http://www.cnblogs.com/billyzh/p/5913687.html
         如果不安装MongoDB会出现后面的一个问题。

    3.MongoDB中的基本概念
    在MongoDB中基本的概念是文档(document)、集合(collection)、数据库(database).
    下图(盗的图)可能容易理解MongoDB中的一些概念:

  

  通过下图实例,可以更直观的的了解MongoDB中的一些概念:

  

二、通过MongoClient建立一个连接
    开始使用pymongo的第一步是创建一个MongoClient,来运行mongod实例。
        >>> from pymongo import MongoClient
        >>> client = MongoClient()
   上面代码将会连接默认的host和port。也可指定:
        >>> client = MongoClient('localhost',27017)
   或者用MongoDB URI格式:
        >>> client = MongoClient('mongodb://localhost:27017/')
   默认状态下Mongo客户端是没有加密的,但是如果需要通过账户登录:
        >>> client = MongoClient('mongodb://账号:密码@localhost:27017/')

三、获取一个数据库
    一个MongoDB实例可以支持多个独立的数据库。使用PyMongo时,可以通过访问MongoClient的属性的方式来访问数据库。
        >>> db = client.test_database
    如果数据库名字使用属性方式不能访问(像test-database),也可以通过访问字典值的方式。
        >>> db = client['test-database']

四、获取一个Collection
    一个collection是一组存在MongoDB中的文件(documents),大致可以认为是关系型数据库中表的概念。
  获取Collection方法与获取数据库方法一致:
       >>> collection = db.test_collection #注意连接符是_不是-
    或用字典方式:
       >>> collection = db['test-collection']
    需要注意的是,MongoDB里的collections(集合)和databases(数据库)都是惰性创建的,前面提到的所有命令
    实际上没有对MongoDB server进行任何操作。当第一个文件插入后,collections和databases才会被创建。

五、文件(Documents)
    数据在MongoDB中是用JSON类文件的形式表示和保存起来的。在pymongo中用字典来代表文件。
    例如,下面这个字典可能被用来代表一篇博客文章:
        >>> import datetime
        >>> post = {
                          "author": "Mike",
         "text": "My first blog post!",
           "tags": ["mongodb","python","pymongo"],
         "date": datetime.datetime.utcnow()
         }
  注意,文件里可以包含python原生(native)类型(datetime.datetime实例),这些类型的值会被自动在原生类型和BSON格式之间转换。

六、插入一个文件(Inserting a Document)
    插入一个文件到collection中,可以使用insert_one()方法。
        >>> posts = db.posts
        >>> post_id = posts.insert_one(post).inserted_id
        >>> post_id
        ObjectId('57eb8f2177eddf292cbea0b3')
    当一个文件被插入一个特殊的键值'_id',即使文件内没有_id这个键值,那么系统自动添加一个到文件里。
    这是一个特殊键值,它的值在整个collection里是唯一的。insert()返回这个文件的_id值。
    插入第一个文件后,这个posts collection 就真正的在server上创建了。我们可以通过查看数据库上的
    所有collection来验证:
        >>> db.collection_names(include_system_collections=False)
        ['posts']

七、获取单个文件 find_one()
    在MongoDB中,最基本的查询是find_one。这个方法返回一个符合查询的文件,或者在没有匹配的时候返回None。
    当只有一个文件符合条件的时候,或者只对第一个符合条件的文件感兴趣的时候,这个方法是很有用的。
    我们用find_one()来获取posts collection 里的第一个文件:
        >>> posts.find_one()
        {'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike',
        '_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'],
        'text': 'My first blog post!'}
    返回结果是一个我们之前插入的符合条件的字典类型值。
    注意,返回的文件里包含_id这个键值,这是自动添加的。
    find_one()还支持对特定元素进行匹配的查询。限制我们文档的作者是"Mike",可以这么做:
       >>> posts.find_one({"author":"Mike"})
       {'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike',
       '_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'],
       'text': 'My first blog post!'}
    如果我们用不同的作者,比如:"Eliot",将不会得到结果。
        >>> posts.find_one({"author":"Eliot"})
        >>>

八、按照ObjectId查询
    通过_id也可以进行查询,在例子中就是ObjectId:
         >>> post_id
         ObjectId('57eb54a877eddf292cbea0a8')
         >>> posts.find_one({"_id": post_id})
        {'date': datetime.datetime(2016, 9, 28, 5, 25, 53, 6000), 'author': 'Mike',
        '_id': ObjectId('57eb54a877eddf292cbea0a8'), 'tags': ['mongodb', 'python'],
        'text': 'My first blog post!'}
    注意:ObjectId 并不等同于它的字符串形式。
       >>> post_id_as_str = str(post_id)
       >>> posts.find_one({"_id": post_id_as_str}) #No result
       >>>
    在web应用的一个常见任务就是在request的URL里获取ObjectId,然后找到与之匹配的文件。
    在本例中,必须要先从字符串转换为ObjectId,然后传给find_one:
    >>> from bson.objectid import ObjectId
    #从URL里获取post_id,然后把它作为字符串传入
    >>> def get(post_id):
           #将字符串转换为ObjectId
           document = client.db.collection.find_one({"_id": ObjectId(post_id)})
    小插曲:
    MongoDB以BSON格式保存数据。BSON字符串都是UTF-8编码的,所以pymongo必须确保它保存的字符串值
    包含有效地UTF-8数据.常规字符串(<type ‘str’>)都是有效的,可以不改变直接保存。
    Unicode字符串(<type ‘unicode’>)就需要先编码成UTF-8格式。

九、批量插入
    为了让查询更有趣,我们多插入几个文件。除了单个文件插入,也可以通过给insert_many()方法传入
    一个列表(list),作为该方法的第一个参数,进行批量插入操作。
    这将会插入列表(list)中的每个文件(document)到集合中去,而且只向server发送一条命令:
          new_posts = [{"author": "Mike",
              "text": "Another post!",
            "tags": ["bulk", "insert"],
            "date": datetime.datetime(2009, 11, 12, 11, 14)
           },
          {"author": "Eliot",
            "title": "MongoDB is fun",
            "text": "and pretty easy too!",
           "date": datetime.datetime(2009, 11, 10, 10, 45)
          }]
    >>> result = posts.insert_many(new_posts)
    >>> result.inserted_ids
    [ObjectId('57eb700b77eddf292cbea0a9'), ObjectId('57eb700b77eddf292cbea0aa')]
    这个例子里有一些比较有趣的地方:
    insert_many()现在返回两个ObjectId实例,每个代表一个插入的文件。
    new_posts[1]与其他的posts内容格式不相同,里面没有"tags”。另外我们增加了一个新的“title”域。这就是MongoDB所提到的无schema特点。

十、查询多个文件
    为了得到更多的文件,我们使用find()方法。find()返回一个Cursor实例,可使我们遍历所有匹配的文件。
    比如遍历每个posts collection里的文件:
         >>> for post in posts.find():
     post
    与使用find_one()时候相同,可以传入一个文件来限制查询结果。比如查询作者"Mike" 文件:
   >>> for post in posts.find({"author":"Mike"}):
        post


十一、文件数量(Counting)
    如果只想知道符合查询条件的文件有多少,可以用count()操作,而没必要进行完整的查询。
    查询collection的文件总数:
         >>> posts.count()
         11
    或者只是查询一些特定文件数量:
        >>> posts.find({"author": "Mike"}).count()
        10


十二、限定范围的查询
    MongoDB支持多种高级查询。比如我们按照时间(小于某个时间)来查询,结果按作者名参数来排序:
        >>> d = datetime.datetime(2009,11,12,12)
        >>> for post in posts.find({"date":{"$lt":d}}).sort("author"):
                     print(post)
   {'date': datetime.datetime(2009, 11, 10, 10, 45), 'author': 'Eliot', 'text': 'and pretty easy too!', '_id': ObjectId('57eb700b77eddf292cbea0aa'),        'title': 'MongoDB is fun'}
   {'date': datetime.datetime(2009, 11, 12, 11, 14), 'author': 'Mike', '_id': ObjectId('57eb700b77eddf292cbea0a9'), 'tags': ['bulk', 'insert'],                'text': 'Another post!'}
    这里使用了特殊的"$lt"操作符来进行范围查询,并调用sort()方法,对结果按照作者参数排序。


十三、索引(Indexing)
    添加索引可以帮助加快某些查询,也可以添加额外的功能来查询和存储文件。
    在这个示例中,我们将演示如何在一个键上创建一个唯一索引,这个索引将拒绝--那些已经在索引中存在该键值的文件。
    首先,我们需要创建一个索引:
        >>> result = db.profiles.create_index([('user_id',pymongo.ASCENDING)],unique = True)
        >>> result
        'user_id_1'
       >>> list(db.profiles.index_information())
        ['_id_', 'user_id_1']
   注意:现在我们有两个索引,一个索引 _id是MongoDB自己创建的。另外一个 user_id是我们刚刚创建的。
   现在,让我们建立一些用户配置文件:
  >>> user_profiles = [{'user_id':211,'name':'Luke'},{'user_id':212,'name':'Ziltoid'}]
  >>> result = db.profiles.insert_many(user_profiles)
 该索引可以防止我们的user_id已经插入集合中的文档:
  >>> new_profile = {'user_id': 213, 'name': 'Drew'}
  >>> duplicate_profile = {'user_id': 212, 'name': 'Tommy'}
  >>> result = db.profiles.insert_one(new_profile) # This is fine.
  >>> result = db.profiles.insert_one(duplicate_profile)
  Traceback (most recent call last):
  pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: test_database.profiles index: user_id_1 dup key: { : 212 }
    关于索引的MongoDB文档链接:

问题:
  1.pymongo.errors.ServerSelectionTimeoutError: localhost:27017: [WinError 10061] 由于目标计算机积极拒绝,无法连接。

    原因:未装MongoDB或者MongoDB服务没有开启。(这个错误找了很长时间,哎。。。)
        参考链接:http://www.cnblogs.com/greenteaone/p/3745734.html

  2.在数据库存入了文件,如何查看呢?就需要用到MongoDB可视化工具了。

    1)MongoBooster(已用)
      下载地址:http://mongobooster.com/home
    2)Robomongo
      下载地址:https://robomongo.org/

posted @ 2016-09-29 08:32  billyz  阅读(6686)  评论(1编辑  收藏  举报