Django+MongoDB

bala bala NoSQL & MongoDB

目前NoSQL还没有一个标准的定义,最常见的解释是"non-relational",也有很多人解释为“Not Only SQL”。NoSQL通常意味着非关系型、分布式的数据存储,具备大数据量下的高性能,横向扩展能力,以及灵活的数据模型。也许,还意味着开源。

MongoDB是一种以文档形式存储的NoSQL。其主要的特性

API: BSON
Protocol: lots of langs
Query Method: dynamic object-based language & MapReduce
Replication: Master Slave & Auto-Sharding
Written in: C++
Concurrency: Update in Place
Misc: Indexing, GridFS Links

Django对NoSQL的支持

是的,Django将原生支持NoSQL,但是不是现在。

你可能听说过django-nonrel 。即Django none relationship,非关系型的Django。django-nonrel提供了一层adapter,配合特定的backend,可以连接各种NoSQL。比如连接MongoDB的django-mongodb-engine。但是,django-nonrel 的实现是在内存中模拟SQL数据库操作,这种思路没有得到Django核心的支持,所以只能是一个外部版本。

query-refactor是GSoC(Google Summer of Code)的Django项目之一,已经进入Django的官方分支。query-refactor的作者Alex早已公布了query-refactor的“最终状态但是,由于该分支的完成时间与Django1.3的发布时间过于接近,所以没有赶上,在Django1.4的新特性清单docs.djangoproject.com—1.4中也没有找query-refactor的身影。如果有消息灵通人士不妨透露一下。

注:Alex并不是无名小卒,我们知道Django在1.2之前是不支持多数据库的,正是由于Alex的努力,我们才能享用Django的多数据库特性。

Django + MongoDB的抉择

  1. 最直接的方式是使用PyMongo——MongoDB提供的Python Driver。但是用惯了Django的Model层,实在不愿意自己去维护数据库连接,写一大堆CRUD的语句。
  2. 而django-nonrel,如前所述,未必是一个好的选择。同样的原因,django-mongodb-engine是基于django-nonrel的MongoDB backend实现,也不予考虑。
  3. MongoEngine,在Django官方的支持出来之前,我认为这是最好的选择。因为MongoEngine可以提供与Django Model(ORM)非常类似的体验,可以快速上手。看一下官网首页的例子:
    from mongoengine import *                           # To define a schema for a 
    # document, we create a
    class Metadata(EmbeddedDocument): # class that inherits from
    tags = ListField(StringField()) # Document.
    revisions = ListField(IntField()) #
    # Fields are specified by
    class WikiPage(Document): # adding field objects as
    title = StringField(required=True) # class attributes to the
    text = StringField() # document class.
    metadata = EmbeddedDocumentField(Metadata) #
    # Querying is achieved by
    >>> page.title = “Hello, World!” # calling the objects
    >>> for page in WikiPage.objects: # attribute on a document
    >>> print page.title # class.

Django+MongoEngine

首先安装MongoEngine(依赖pymongo)。之后在python shell中实验一下:

from mongoengine import *

connect('employeeDB')
class Employee(Document):
name = StringField(max_length=50)
age = IntField(required=False)

john = Employee(name="John Doe", age=25)
john.save()

jane = Employee(name="Jane Doe", age=27)
jane.save()

for e in Employee.objects.all():
print e["id"], e["name"], e["age"]

在Django中使用也很容易,只需在models.py(如果你十分介意,也可以单独放在docs.py中)这样写:

from mongoengine import *
from mysite.settings import DBNAME

connect(DBNAME)
class Employee(Document):
name = StringField(max_length=50)
age = IntField(required=False)

其中,DBNAME在settings.py中指定。

然后,在视图中就可以使用“文档模型“了。

其他

1.Mongo Engine的Field类型与Django ORM的Field类型有所不同,下面是一个简单的对比:

 
MongoEngine Django
StringField CharField
URLField URLField
EmailField EmailField
IntField IntegerField
FloatField FloatField
DecimalField DecimalField
BooleanField BooleanField
DateTimeField DateTimeField
EmbeddedDocumentField --
DictField --
ListField --
SortedListField --
BinaryField --
ObjectIdField --
FileField FileField

2.尽管看起来像是ORM,但MongoDB绝对不是RDB。我想MongoEngine这样的设计是为了方便上手,但是使用的时候,一定要按照NoSQL的方式去思考问题。

 

posted @ 2012-03-11 22:54  心内求法  阅读(24075)  评论(2编辑  收藏  举报