MongoDB简介
MongoDB 简介
一、基本概况
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。
它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:
· 面向集合存储,易存储对象类型的数据。
· 模式自由。
· 支持动态查询。
· 支持完全索引,包含内部对象。
· 支持查询。
· 支持复制和故障恢复。
· 使用高效的二进制数据存储,包括大型对象(如视频等)。
· 自动处理碎片,以支持云计算层次的扩展性
· 支持RUBY,PYTHON,JAVA,C++,PHP等多种语言。
· 文件存储格式为BSON(一种JSON的扩展)
· 可通过网络访问
所谓“面向集合”(Collenction-Orented),意思是数据被分组存储在数据集中,被称为一个集合(Collenction)。每个 集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。集合的概念类似关系型数据库(RDBMS)里的表(table),不同的是它不需要定 义任何模式(schema)。
模式自由(schema-free),意味着对于存储在mongodb数据库中的文件,我们不需要知道它的任何结构定义。如果需要的话,你完全可以把不同结构的文件存储在同一个数据库里。
存储在集合中的文档,被存储为键-值对的形式。键用于唯一标识一个文档,为字符串类型,而值则可以是各中复杂的文件类型。我们称这种存储形式为BSON(Binary Serialized dOcument Format)。
MongoDB服务端可运行在Linux、Windows或OS X平台,支持32位和64位应用,默认端口为27017。推荐运行在64位平台,因为MongoDB在32位模式运行时支持的最大文件尺寸为2GB。
二、入门使用
前面的一段摘自各种百科,总结一下,MongoDB具有像关系数据库查询和非关系数据库结构松散的优点,在分布式存储上有巨大的优势。其中有3个元素:数据库,集合,文档,集合就和我们在关系数据库中的表很相似,文档就和元组很相似。
MongoDB是一款轻量级的绿色的数据库系统,下载完以后直接解压就可以使用,在bin的目录下,就可以开启数据库,如图:
其中--dbpath参数用于指定数据库存放的路径(路径需要是一个存在的目录),然后在http://localhost:27017中可以看到服务的开启情况:如图
在端口28017中可以以http的方式管理数据库,如图:
下面简单介绍一下MongoDB的基础操作,就是增删改,在cmd中,mongodb的bin目录下直接输入mongo,即可以进入shell客户端,默认数据库为test,如图:
1、Insert
可以直接在数据库里面插入一个文档(元组),如图:
user即为集合名(表名),不用预先建立,文档是BSON形式,通俗说就是一个key-value的形式,属性之间用","隔开。
2、Find
Find很像关系数据库里面的select,如图:
其中_id是默认的唯一标示符。
前面说到MongoDB的存储具有很强的灵活性,在user里面可以不用定义字段名,甚至插入不同字段名的元组,如图:
3、Update
Update的方法中第一个参数为查询条件,第二个参数为更新内容,如图:
4、Remove
Remove中不带参数的话可以删除所有文档,如图:
Remove的操作是不可逆的。
三、分布式存储入门
下面就是MongoDB令人激动的特性了。读写分离,集群部署这些对于MongoDB来说都很轻易就可以实现。而MongoDB还有更丰富的特性。
1、主从复制
先上一张结构图:
这是一般的主从架构,可以方便地实现读写分离,数据备份,数据恢复。在实际应用中会有多台服务器,为了方便,我把MongoDB复制在多个目录来模拟多台服务器,下面来实践:
第一步,复制MongoDB文件夹到另外两个目录\salver\mongoDB和\salver\MongoDB2
第二步,启动\mongoDB中的数据库,并设为主数据库,并设置端口为12345如图:
第三步,设置从数据库,命令为:mongod --dpath=... --slave --source=...,如图:
可以看到,slaver已经和master建立了联系:
下面我们来做测试,首先在12345端口中添加文档:
然后在12344端口中查看:
可以看到数据已经同步了。
2、副本集
副本集是MongoDB一种很厉害的主从集群,他有2个特点:
(1)副本集没有固定的主数据库
(2)如果当前的主数据库宕机了,集群中会自动推选出一个从数据库作为主数据库使用,实现自动故障恢复的功能,就不会存在单点故障了。
下面来实验:
第一步:建立集群,给集群取一个名字叫gary:
replSet参数指定了在7777下有一个数据库服务器,但是实际上我们还没有建立,不过mongodb会5秒中一次尝试连接。
第二步:建立另一个数据库服务器:
第三步:初始化副本集,将一台服务器设置为主服务器,这里进入8888端口的admin集合做如下设置:
用rs.status()可以查看配置信息,在stateStr属性中可以看到端口8888被分配为主服务器了,如图:
第四步:在集群中需要一个仲裁服务器来保证一致性和起斡旋作用,所以我们设置slaver/mongodb2下,端口6666作为仲裁服务器,如图:
在端口为8888的服务器下执行addArb()指令增加仲裁服务器,如图:
这时,我们已经建立起一个副本集,关掉8888端口,再用rs.status()查看,可以看到7777被升为主服务器了,如图: