MongoDB 基础

一、基本概念

  在正式介绍MongoDB之前,我们先来说说NoSql.

  • NoSQL 简介

  NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL"。在现代的计算系统上每天网络上都会产生庞大的数据量。这些数据有很大一部分是由关系数据库管理系统(RDMBSs)来处理。NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。

  • 关系型数据库遵循ACID规则

  事务在英文中是transaction,和现实世界中的交易很类似,它有如下四个特性:

  1、A (Atomicity) 原子性

  原子性很容易理解,也就是说事务里的所有操作要么全部做完,要么都不做,事务成功的条件是事务里的所有操作都成功,只要有一个操作失败,整个事务就失败,需要回滚。

   比如银行转账,从A账户转100元至B账户,分为两个步骤:1)从A账户取100元;2)存入100元至B账户。这两步要么一起完成,要么一起不完成,如果只完成第一步,第二步失败,钱会莫名其妙少了100元。

   2、C (Consistency) 一致性

  一致性也比较容易理解,也就是说数据库要一直处于一致的状态,事务的运行不会改变数据库原本的一致性约束。

   例如现有完整性约束a+b=10,如果一个事务改变了a,那么必须得改变b,使得事务结束后依然满足a+b=10,否则事务失败。

  3、I (Isolation) 独立性

  所谓的独立性是指并发的事务之间不会互相影响,如果一个事务要访问的数据正在被另外一个事务修改,只要另外一个事务未提交,它所访问的数据就不受未提交事务的影响。

  比如现有有个交易是从A账户转100元至B账户,在这个交易还未完成的情况下,如果此时B查询自己的账户,是看不到新增加的100元的。

  4、D (Durability) 持久性

  持久性是指一旦事务提交后,它所做的修改将会永久的保存在数据库上,即使出现宕机也不会丢失。

  • 分布式系统 

  分布式系统(distributed system)由多台计算机和通信的软件组件通过计算机网络连接(本地网络或广域网)组成。分布式系统是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。

  优点:可靠性(容错),可扩展性,资源共享,灵活性,更快的速度,更高的性能

  缺点:故障排除和诊断问题困难,开发系统的特性让分布式计算系统存在着数据的安全性和共享的风险等问题

  • 为什么使用NoSQL?

  首先来说说传统关系型数据库的瓶颈,无法应对每秒上万次的读写请求,硬盘IO此时也将变为性能瓶颈;表中存储记录数量有限,横向可扩展能力有限,纵向数据可承受能力也是有限的,面对海量数据,势必涉及到分库分表,难以维护;大数据查询SQL效率极低,数据量到达一定程度时,查询时间会呈指数级别增长;难以横向扩展,无法简单地通过增加硬件、服务节点来提高系统性能

  NoSQL数据库优点:海量数据下,读写性能优异;数据模型灵活;数据间无关系,易于扩展

  缺点: 没有标准化;有限的查询功能;最终一致是不直观的程序

  分类:键值存储数据库----Redis,适用场景:会话信息,用户配置信息,购物车

     列存储数据库------BigTable,Cassandra,HBase,适用场景:事件记录,内容管理,博客平台,不适合需要ACID事务的场合

       文档型数据库-------MongoDB,适用场景:事件记录,内容管理,博客平台,网站分析,实时分析,电子商务应用

     图数据库-------Neo4j,适用场景:社交网络,推荐引擎,基于位置的服务

二、MongoDB基础知识

  MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。

  MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。

  MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。

{
    name:'Davve',
    age:29,
    status:'A',
    group:['news','sports',]
}

  主要特点:

  • MongoDB的提供了一个面向文档存储,操作起来比较简单和容易。
  • 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName="Sameer",Address="8 Gandhi Road")来实现更快的排序。
  • 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片
  • Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
  • MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
  • MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。

  基本术语

      

  数据库 

  一个mongodb中可以建立多个数据库。

  MongoDB的默认数据库为"db",该数据库存储在data目录中。

  MongoDB的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。

  "show dbs" 命令可以显示所有数据的列表。

   执行 "db" 命令可以显示当前数据库对象或集合。

  运行"use"命令,可以连接到一个指定的数据库。如:use local

    文档:{“name”:"davve",gender:'male'}

  RDBMS 与 MongoDB 对应的术语:

    

  注意点:

  1. 文档中的键/值对是有序的。
  2. 文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
  3. MongoDB区分类型和大小写。
  4. MongoDB的文档不能有重复的键。
  5. 文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。

  集合

  集合就是 MongoDB 文档组,类似于 RDBMS (关系数据库管理系统:Relational Database Management System)中的表格。

  集合存在于数据库中,集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。

  比如,我们可以将以下不同数据结构的文档插入到集合中:

{"site":"www.baidu.com"}
{"site":"www.google.com","name":"Google"}
{"site":"www.runoob.com","name":"alex","num":5}

  注意:当第一个文档插入时,集合就会被创建。

  创建集合:db.createCollection("mycoll", {capped:true, size:100000})

 基本数据类型

    

 

 

 

posted @ 2017-10-19 17:42  看雪。  阅读(175)  评论(0编辑  收藏  举报