MongoEngine 查询语法

本文转自:

1、MongoEngine 查询

2、Mongoengine的取、排序and指定

 

数据库查询

#查询结果转换成字典
users_dict = User.objects().to_mongo()

# 排序,按日期排列
user = User.objects.order_by("date")

# 按日期倒序

user = User.objects.order_by("-date")

 

Document 对象有一个 objects 属性,用来访问在数据库中跟这个类有关的对象。这个 objects 属性其实是一个QuerySetManager ,它会创建和返回一个新的 QuerySet 对象的访问。这个 QuerySet 对象可以从数据库中遍历获取的文档:

  1.  
    # Prints out the names of all the users in the database
  2.  
    for user in User.objects:
  3.  
    print user.name
     
     
     

过滤查询

可以通过调用 QuerySet 对象的关键字参数来对数据查询进行过滤,关键字查询中的键和你想要查询的Document 中的字段一致:

  1.  
    # This will return a QuerySet that will only iterate over users whose
  2.  
    # 'country' field is set to 'uk'
  3.  
    uk_users = User.objects(country='uk')

对于内嵌document的字段可以使用 __ 来代替对象属性访问语法中的 . 进行访问:

  1.  
    # This will return a QuerySet that will only iterate over pages that have
  2.  
    # been written by a user whose 'country' field is set to 'uk'
  3.  
    uk_pages = Page.objects(author__country='uk')

查询操作符

在查询中也可以使用操作符,只要将其加在关键字的双下划线之后即可:

  1.  
    # Only find users whose age is 18 or less
  2.  
    young_users = Users.objects(age__lte=18)

可用的运算符如下:

  • ne – 不等于

  • lt – 小于<

  • lte – 小于等于

  • gt – 大于>

  • gte – 大于等于 

  • not – 否定一个标准的检查,需要用在其他操作符之前(e.g. Q(age__not__mod=5))

  • in – 值在 list 中

  • nin – 值不在 list 中

  • mod – value % x == y, 其中 x 和 y 为给定的值

  • all – list 里面所有的值

  • size – 数组的大小

  • exists – 存在这个值

字符串查询

以下操作符可以快捷的进行正则查询:

  • exact – 字符串型字段完全匹配这个值

  • iexact – 字符串型字段完全匹配这个值(大小写敏感)

  • contains – 字符串字段包含这个值

  • icontains – 字符串字段包含这个值(大小写敏感)

  • startswith – 字符串字段由这个值开头

  • istartswith – 字符串字段由这个值开头(大小写敏感)

  • endswith – 字符串字段由这个值结尾

  • iendswith – 字符串字段由这个值结尾(大小写敏感)

  • match – 执行 $elemMatch 操作,所以你可以使用一个数组中的 document 实例

地理查询

PASS

列表查询

对于大多数字段,这种语法会查询出那些字段与给出的值相匹配的document,但是当一个字段引用 ListField 的时候,而只会提供一条数据,那么包含这条数据的就会被匹配上:

  1.  
    class Page(Document):
  2.  
    tags = ListField(StringField())
  3.  
     
  4.  
    # This will match all pages that have the word 'coding' as an item in the
  5.  
    # 'tags' list
  6.  
    Page.objects(tags='coding')

原始查询

你可以通过 __raw__ 参数来使用一个原始的 PyMongo 语句来进行查询,这样可以进行原始的完整查询:

Page.objects(__raw__={'tags': 'coding'})

限制和跳过结果

就像传统的ORM一样,你有时候需要限制返回的结果的数量,或者需要跳过一定数量的结果。QuerySet 里面可以使用 limit() 和 skip() 这两个方法来实现,但是更推荐使用数组切割的语法:

  1.  
    # Only the first 5 people
  2.  
    users = User.objects[:5]
  3.  
     
  4.  
    # All except for the first 5 people
  5.  
    users = User.objects[5:]
  6.  
     
  7.  
    # 5 users, starting from the 11th user found
  8.  
    users = User.objects[10:15]

你可以指定让查询返回一个结果。如果这个条在数据库中不存在,那么会引发 IndexError 错误 。使用 first() 方法在数据不存在的时候会返回 None

  1.  
    >>> # Make sure there are no users
  2.  
    >>> User.drop_collection()
  3.  
    >>> User.objects[0]
  4.  
    IndexError: list index out of range
  5.  
    >>> User.objects.first() == None
  6.  
    True
  7.  
    >>> User(name='Test User').save()
  8.  
    >>> User.objects[0] == User.objects.first()
  9.  
    True

默认Document 查询

默认情况下,Documentobjects 属性返回一个一个 QuerySet 对象,它并没有进行任何筛选和过滤,它返回的是所有的数据对象。这一点可以通过给一个 document 定义一个方法来修改 一个queryset 。这个方法需要两参数__doc_cls 和 queryset 。第一个参数是定义这个方法的 Document 类名(从这个意义上来说,这个方法像是一个 classmethod() 而不是一般的方法),第二个参数是初始化的 queryset。这个方法需要使用 queryset_manager()来装饰来它,使得它被认可。

  1.  
    class BlogPost(Document):
  2.  
    title = StringField()
  3.  
    date = DateTimeField()
  4.  
     
  5.  
    @queryset_manager
  6.  
    def objects(doc_cls, queryset):
  7.  
    # This may actually also be done by defining a default ordering for
  8.  
    # the document, but this illustrates the use of manager methods
  9.  
    return queryset.order_by('-date')

你不用调用 objects 方法,你可以自定义更多的管理方法,例如:

  1.  
    class BlogPost(Document):
  2.  
    title = StringField()
  3.  
    published = BooleanField()
  4.  
     
  5.  
    @queryset_manager
  6.  
    def live_posts(doc_cls, queryset):
  7.  
    return queryset.filter(published=True)
  8.  
     
  9.  
    BlogPost(title='test1', published=False).save()
  10.  
    BlogPost(title='test2', published=True).save()
  11.  
    assert len(BlogPost.objects) == 2
  12.  
    assert len(BlogPost.live_posts()) == 1

自定义 QuerySets

当你想自己定义一些方法来过滤 document 的时候,继承 QuerySet 类对你来说就是个好的方法。为了在 document 里面使用一个自定义的 QuerySet 类,你可以在 document 里的 meta 字典里设置 queryset_class 的值来实现它。

  1.  
    class AwesomerQuerySet(QuerySet):
  2.  
     
  3.  
    def get_awesome(self):
  4.  
    return self.filter(awesome=True)
  5.  
     
  6.  
    class Page(Document):
  7.  
    meta = {'queryset_class': AwesomerQuerySet}
  8.  
     
  9.  
    # To call:
  10.  
    Page.objects.get_awesome()

Aggregation 聚合

MongoDB 提供了开箱即用的聚合方法,但没有 RDBMS 提供的那样多。MongoEngine 提供了一个包装过的内置的方法,同时自身提供了一些方法,它实现了在数据库服务上执行的 Javascript 代码的功能。

结果计数

就像限制和跳过结果一样, QuerySet 对象提供了用来计数的方法 - count(),不过还有一个更 Pythonic 的方法来实现:

num_users = len(User.objects)

更多功能

当你想为 document 的特定的字段的数量计数的时候,可以使用 sum()

yearly_expense = Employee.objects.sum('salary')

当你想求某个字段的平均值的时候,可以使用 average()

mean_age = User.objects.average('age')

MongoEngine 提供了一个方法来获取一个在集合里 item 的频率 - item_frequencies()。下面一个例子可以生成 tag-clouds

  1.  
    class Article(Document):
  2.  
    tag = ListField(StringField())
  3.  
     
  4.  
    # After adding some tagged articles...
  5.  
    tag_freqs = Article.objects.item_frequencies('tag', normalize=True)
  6.  
     
  7.  
    from operator import itemgetter
  8.  
    top_tags = sorted(tag_freqs.items(), key=itemgetter(1), reverse=True)[:10]

查询效率和性能

PASS

高级查询

有时候使用关键字参数返回的 QuerySet 不能完全满足你的查询需要。例如有时候你需要将约束条件进行andor 的操作。你可以使用 MongoEngine 提供的 Q 类来实现,一个 Q 类代表了一个查询的一部分,里面的参数设置与你查询document 的时候相同。建立一个复杂查询的时候,你需要用 & 或 | 操作符将 Q 对象连结起来。例如:

  1.  
    from mongoengine.queryset.visitor import Q
  2.  
     
  3.  
    # Get published posts
  4.  
    Post.objects(Q(published=True) | Q(publish_date__lte=datetime.now()))
  5.  
     
  6.  
    # Get top posts
  7.  
    Post.objects((Q(featured=True) & Q(hits__gte=1000)) | Q(hits__gte=5000))

Atomic updates(原子更新)

MongoDB 文档 可以通过QuerySet 上的 update_one()update()modify() 方法自动更新。下面几种操作符可以被用到这几种方法上:

  • set – 设置成一个指定的值

  • unset – 删除一个指定的值

  • inc – 将值加上一个给定的数

  • dec – 将值减去一个给定的数

  • push – 在 list 中添加一个值

  • push_all – 在 list 中添加一个值

  • pop – 移除list 的第一项或最后一项(根据 pop__<field>=val val 的值决定删除第一项还是最后一项,一般情况下,val 为负则删除第一项,为正则删除最后一项,参见:mongodb $pop

  • pull – 从 list 里面移除一个值

  • pull_all – 从 list 里面移除个值

  • add_to_set – 当要添加的值不在 list 中时,添加这个值

原子更新的语法类似于查询语法,区别在于修饰操作符位于字段之前,而不是之后:

  1.  
    >>> post = BlogPost(title='Test', page_views=0, tags=['database'])
  2.  
    >>> post.save()
  3.  
    >>> BlogPost.objects(id=post.id).update_one(inc__page_views=1)
  4.  
    >>> post.reload() # the document has been changed, so we need to reload it
  5.  
    >>> post.page_views
  6.  
    1
  7.  
    >>> BlogPost.objects(id=post.id).update_one(set__title='Example Post')
  8.  
    >>> post.reload()
  9.  
    >>> post.title
  10.  
    'Example Post'
  11.  
    >>> BlogPost.objects(id=post.id).update_one(push__tags='nosql')
  12.  
    >>> post.reload()
  13.  
    >>> post.tags
  14.  
    ['database', 'nosql']

如果没有修饰操作符,则默认为$set

  1.  
    BlogPost.objects(id=post.id).update(title='Example Post')
  2.  
    BlogPost.objects(id=post.id).update(set__title='Example Post')

服务器端 JavaScript 执行

可以写 Javascript函数,然后发送到服务器来执行。它返回结果是 Javascript 函数的返回值。这个功能是通过QuerySet()对象的exec_js() 方法实现。传递一个包含一个Javascript函数的字符串作为第一个参数。

其余位置的参数的名字字段将作为您的Javascript函数的参数传递过去。

在 JavaScript 函数范围中,一些变量可用:

  • collection – 对应使用的 Document 类的集合的名称

  • query – 一个 QuerySet 对象

  • options – 一个对象,它包含要传递给 exec_js() 函数的一些参数

 
  1.  
    def sum_field(document, field_name, include_negatives=True):
  2.  
    code = """
  3.  
    function(sumField) {
  4.  
    var total = 0.0;
  5.  
    db[collection].find(query).forEach(function(doc) {
  6.  
    var val = doc[sumField];
  7.  
    if (val >= 0.0 || options.includeNegatives) {
  8.  
    total += val;
  9.  
    }
  10.  
    });
  11.  
    return total;
  12.  
    }
  13.  
    """
  14.  
    options = {'includeNegatives': include_negatives}
  15.  
    return document.objects.exec_js(code, field_name, **options)
posted @ 2020-10-16 12:04  一路向北321  阅读(222)  评论(0编辑  收藏  举报