MongoDB学习笔记

在之前的博文《Windows下安装MongoDB》 中我在Windows7环境中安装了MonogoDB。这篇文章将介绍一些MongoDB的基本概念和语法,并介绍一下利用python语言操作MongoDB的教程。
博文的内容参考MongoDB教程

概念

  • NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL"。
  • RDBMS vs NoSQL
    RDBMS

    • 高度组织化结构化数据
    • 结构化查询语言(SQL) (SQL)
    • 数据和关系都存储在单独的表中。
    • 数据操纵语言,数据定义语言
    • 严格的一致性
    • 基础事务

    NoSQL

    • 代表着不仅仅是SQL
    • 没有声明性查询语言
    • 没有预定义的模式
    • 键 - 值对存储,列存储,文档存储,图形数据库
    • 最终一致性,而非ACID属性
    • 非结构化和不可预知的数据
    • CAP定理
    • 高性能,高可用性和可伸缩性
  • NoSQL的优点/缺点
    优点:

    • 高可扩展性
    • 分布式计算
    • 低成本
    • 架构的灵活性,半结构化数据
    • 没有复杂的关系

    缺点:

    • 没有标准化
    • 有限的查询功能(到目前为止)
    • 最终一致是不直观的程序
  • MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。主要特点包括:
    • MongoDB的提供了一个面向文档存储,操作起来比较简单和容易。
    • 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName="Sameer",Address="8 Gandhi Road")来实现更快的排序。
    • Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
    • MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
    • Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
    • Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
    • Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
    • GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
    • MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
    • MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
  • MongoDB中,数据库db=database,数据库表table=collection,数据记录行row=document,数据集字段column=field,索引index=index,自动将_id字段设为主键,没有join操作。文档是一组键值对,MongoDB的文档不需要设置字段和字段类型,键值对是有序的,MongoDB不能有重复的键,文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
  • MongoDB中需要保留三个数据库名,它们是安装好创建并支持直接访问:
    • admin: 从权限的角度来看,这是"root"数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
    • local: 这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合。
    • config: 当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。
  • 默认创建collections和db的方法
    使用use db_name默认创建数据仓库db_name,然后通过db.collection_name.insert(document)可以默认创建collection
posted @ 2017-05-03 11:23  柯君  阅读(157)  评论(0编辑  收藏  举报