MongoDB基础
1. MongoDB简介
1、什么是MongoDB
MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。
在高负载的情况下,添加更多的节点,可以保证服务器性能。
MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。
2、特点
1. MongoDB的提供了一个面向文档存储,操作起来比较简单和容易。
2. 可以在MongoDB记录中设置任何属性的索引 (如:FirstName="Ning",Address="Beijing")来实现更快的排序。
3. 你可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性。
4. 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。
5. Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
6. MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
7. Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
8. Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
9. Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
10. GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
11. MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
12. MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
3、MongoDB简介
1. MongoDB是一个文档型的NoSQL数据库,文档型---> BSON文档(json的二进制)
2. 保存数据:key-value
3. 一般不支持事务
4、MongoDB使用场景
1)更高的写入负载
默认情况下,MongoDB更侧重高数据写入性能,而非事务安全,MongoDB很适合业务系统中有大量“低价值”数据的场景。
但是应当避免在高事务安全性的系统中使用MongoDB,除非能从架构设计上保证事务安全。
2)高可用性
MongoDB的复副集(Master-Slave)配置非常简洁方便,此外,MongoDB可以快速响应的处理单节点故障,自动、安全的完成故障转移。
这些特性使得MongoDB能在一个相对不稳定(如云主机)的环境中,保持高可用性。
3)表结构不明确,且数据在不断变大
2. MongoDB安装与配置
#下载安装包 wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-3.4.4.tgz tar -xvf mongodb-linux-x86_64-3.4.4.tgz #解压 mv mongodb-linux-x86_64-3.4.4.tgz mongodb #改名称 cd mongodb mkdir db #创建一个存放数据文件的目录 mkdir logs #创建一个存放日志的目录 cd bin vi mongodb.conf #创建配置文件 #在配置文件中写入 dbpath=/usr/local/mongodb/db logpath=/usr/local/mongodb/logs/mongodb.log port=27017 fork=true nohttpinterface=true
参数解读:
--dbpath 数据库路径(数据文件) --logpath 日志文件路径 --master 指定为主机器 --slave 指定为从机器 --source 指定主机器的IP地址 --pologSize 指定日志文件大小不超过64M.因为resync是非常操作量大且耗时,最好通过设置一个足够大的oplogSize来避免resync(默认的 oplog大小是空闲磁盘大小的5%)。 --logappend 日志文件末尾添加,即使用追加的方式写日志 --journal 启用日志 --port 启用端口号 --fork 在后台运行 --only 指定只复制哪一个数据库 --slavedelay 指从复制检测的时间间隔 --auth 是否需要验证权限登录(用户名和密码) --syncdelay 数据写入硬盘的时间(秒),0是不等待,直接写入 --notablescan 不允许表扫描 --maxConns 最大的并发连接数,默认2000 --pidfilepath 指定进程文件,不指定则不产生进程文件 --bind_ip 绑定IP,绑定后只能绑定的IP访问服务
以自定义的 mongodb 配置文件方式启动:
./mongod –config mongodb.conf
查看 mongodb 进程:
ps aux |grep mongodb
查看 mongodb 服务的运行日志:tail -200f /usr/local/mongodb/logs/mongodb.log
检查端口是否已被启动:
netstat -lanp | grep 27017
开机自动启动mongodb:
vi /etc/rc.d/rc.local
/usr/local/mongodb/bin/mongod –config /usr/local/mongodb/bin/mongodb.conf
重启一下系统测试下能不能自启
进入mongodb的shell模式
/usr/local/mongodb/bin/mongo
查看数据库列表
show dbs
当前db版本
db.version();
3. MongoDB数据类型
3. MongoDB基本概念
1、文档
文档是mongoDB的核心概念,文档就是键值对的一个有序集。MongoDB不但区分类型,而且区分大小写。MongoDB的文档不能有重复的键。
2、集合
集合就是一组文档。如果将MongoDB中的一个文档比喻为关系型数据库中的一行。那么一个集合就相当于一张表。
3、动态模式
集合是动态模式的。一个集合中的文档可以是各式各样的。
4、命名
集合使用名称进行标识。集合名可以是满足下列条件的任意UTF-8字符串:
1)集合名不能是空字符串
2)集合名不能包含\0字符(空字符串),这个字符表示集合名的结束。
3)集合名不能以”system.”开头,这是为系统集合准备的前缀。
4)用户创建的集合额不能在集合名中包含字符’′。因为某些系统生成的集合中包含′。因为某些系统生成的集合中包含。
5、子集合
组织集合的一种惯例是使用“.”分隔不同命名空间的子集合。
6、数据库
在MongoDB中,多个文档组成集合,而多个集合可以组成数据库。一个MongoDB实例可以承载多个数据库,每个数据库拥有0个或者多个集合。
每个数库都有独立的权限。
7、数据库命名可以是满足以下条件的任意UTF-8字符串:
1) 不能是空字符串
2) 不得含有/、\、.、”、*、<、>、:、|、?、$(一个空格)、\0(空字符)。
3) 数据库名应全部小写。
4)数据库名最多为64字节。
5) 不能使用admin、local、config,这些数据库名是保留的。