代码改变世界

MongoDB 安装和即基本操作

2014-09-30 11:15  youxin  阅读(363)  评论(0编辑  收藏  举报

http://www.mongodb.org/

Agile and Scalable

MongoDB (from "humongous") is an open-source document database, and the leading NoSQL database. Written in C++, MongoDB features:

   关于mongodb的好处,优点之类的这里就不说了,唯一要讲的一点就是mongodb中有三元素:数据库,集合,文档,其中“集合”

就是对应关系数据库中的“表”,“文档”对应“行”。

 

一: 下载

      上MongoDB官网 ,我们发现有32bit和64bit,这个就要看你系统了,不过这里有两点注意:

          ①:根据业界规则,偶数为“稳定版”(如:1.6.X,1.8.X),奇数为“开发版”(如:1.7.X,1.9.X),这两个版本的区别相信大家都知道吧。

          ②:32bit的mongodb最大只能存放2G的数据,64bit就没有限制。

  ①:启动之前,我们要给mongodb指定一个文件夹,这里取名为”db",用来存放mongodb的数据。

    ②:微软徽标+R,输入cmd,首先找到“mongodb”的路径,然后运行mongod开启命令,同时用--dbpath指定数据存放地点为“db”文件夹。

 

  ③:最后要看下是否开启成功,从图中的信息中获知,mongodb采用27017端口,那么我们就在浏览器里面键入“http://localhost:27017/”,

             打开后,mongodb告诉我们在27017上Add 1000可以用http模式查看mongodb的管理信息。

 

 

MongoDB基本概念

1.文档是MongoDB中数据的基本单元,类似于关系型数据库的行(但比行复杂的多)

2.集合可以看成没有模式的表

3.MongoDB的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限

4.MongoDB自带简洁但功能强大的javascript shell,这个工具对于管理MongoDB实例和操作数据非常有用

5.每一个文档都有一个特殊的键"_id",它在文档所处的集合中是唯一的.

MongoDB入门上

MongoDB基本概念

1.文档是MongoDB中数据的基本单元,类似于关系型数据库的行(但比行复杂的多)

2.集合可以看成没有模式的表

3.MongoDB的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限

4.MongoDB自带简洁但功能强大的javascript shell,这个工具对于管理MongoDB实例和操作数据非常有用

5.每一个文档都有一个特殊的键"_id",它在文档所处的集合中是唯一的.

详细介绍:

a)文档

文档是MongoDB的核心概念.多个键及其关联的值有序的放置在一起便是文档.

大多数语言都有想通的一种数据结构,比如:映射,散列或字典.在javascript里面,文档表示为对象:

{"greeting":"Hello world","age":30}

这个文档只有一个键"greeting",其对应的值为"Hello world".绝大数情况下,文档会比这复杂的多,

经常会包含多个键值对:

{"greeting":"Hello world","Hello":"Refactor"}

文档中的键值对是有序的,上面的文档与下面的文档是不同的:

{"Hello":"Refactor","greeting":"Hello world"}

文档中的值可以是字符串,也可以是其他几种数据类型.如例子中的"age"的值是整数

文档中的键是字符串,除了少数例外的情况下,键可以是任意utf-8字符

键不能含有\0(空字符),这个字符表示键的结尾

.和$只有在特定的环境下才能使用,使用不当的话,驱动程序会提示

下划线"_"开头的键是保留的,虽然这个并不是严格要求的

MongoDB不但区分类型,也区分大小写,下面两个文档是不同的:

{"age":"30"}

{"age":30}

一下文档也是不同的:

{"age":30}

{"Age":30}

MongoDB文档不能有重复键

{"Hello":"Hello world","Hello":"Refactor"}这是不正确的,虽然可以正常操作,但是第二个”hello'会把第一个覆盖。

 

b)集合

集合是一组文档,如果说文档相当于关系型数据库中的行,那么集合相当于表

集合是无模式的,这意味着一个集合里面的文档可以是各种各样的,下面两个文档可以存在同一个集合中:

{"Hello":"Refactor"}

{"Age":30}

注意,上面的文档不光是值的类型不同(字符串和整数),他们的键也是不一样的.因为集合里面可以放置任何文档,

那么就有一个问题:还有必要使用多个集合吗?要是没必要对各种文档划分模式,那么为什么还要使用多个结合呢?

理由如下:

1.把各种各样的文档都混在一个集合里面,开发者要么确保每次查询只返回需要的文档种类,要么让执行查询的

应用程序来处理所有不同类型的文档.如:查询博客文章,还要剔除那么包含有作者数据的文档

2.在一个集合里面查询特定类型的文档在速度上不划算,分开做多个集合要快的多.如:集合里面有个标注类型的键

要查询其值为"Refactor1","Refactor2"或"Refactor3"的文档,就会很慢,如果按照名字分割成3个集合的话,查询会

快的多(参见"子集合")

3.把同种类型的文档放在一个集合里,这样数据很集中.从只含有博客文章的集合里面查询几篇文章,会比从含有文章

和作者数据的集合里面查几篇文章少消耗磁盘寻道操作.

4.当创建索引的时候,文档会有附加的结构(尤其是有唯一索引的时候).索引是按照集合来定义的.把同种类型的文档

放在同一个集合里面.使索引更有效.

集合名为满足下列条件的utf-8字符串

1.集合名不能是空字符串""

2.集合名不能含有\0空字符,这个字符表示集合名的结尾

3.集合名不能以"system."开头,这是为系统集合保留的前缀.如:system.users这个集合保存着数据库的用户信息

system.namespaces集合保存着所有数据库集合的信息.

4.集合名不能包含保留字符"$"

 

子集合

织集合的一种惯例是使用"."字符分开的按命名空间划分的子集合.如:一个带有博客功能的应用可能包含两个集合,

分别是blog.posts和blog.authors.这样做的目的是为了使组织结构更好些,也就是说blog这个集合(可能根本就不存在)

及其子集合没有任何关系.

很多MongoDB工具中都包含子集合

1.GridFS是一种存储大文件的协议,使用子集合来存储文件的元数据,这样就与内容块分开了

2.MongoDB的web控制台通过子集合的方式将数据组织在DBTOP部分

3.数据库shell里面,db.blog代表blog集合,db.blog.posts代表blog.posts集合

在MongoDB中使用子集合是组织数据的最好方法.

 

 

 

由于是开篇,就大概的说下基本的“增删查改“,我们再开一个cmd,输入mongo命令打开shell,其实这个shell就是mongodb的客户端,

同时也是一个js的编译器,默认连接的是“test”数据库

2、切换/创建数据库
>use yourDB;
当创建一个集合(table)的时候会自动创建当前数据库
 
查询所有数据库
show dbs;
查看当前使用的数据库
db.getName();
db;
db和getName方法是一样的效果,都可以查询当前使用的数据库
 
9、显示当前db状态
db.stats();

2 添加windows系统服务

运行cmd.exe

> cd D:\mongodb\bin

> D:\mongodb\bin>mongod --dbpath "D:\mongodb\data\db" --logpath "D:\mongodb\log\mongo.log" --install --serviceName "MongoDB"

服务名为MongoDB

运行命令成功为如下图:

引时服务已经安装成功,运行

>NET START MongoDB   (开启服务)

>NET stop MongoDB   (关闭服务)

3 关闭数据库

通过命令关闭,尽量不要直接关闭服务,防止磁盘写入未完成导致数据丢失

>use admin

>db.shutdownServer();


windows 下启动MongoDB的rest接口

动mongodb后,在web端口访问情况下,点击List all commands会出现如下错误

 

REST is not enabled.  use --rest to turn on.
check that port 28017 is secured for the network too.
 
原因是rest未启动,现在给出windows下的解决方案

 

以命令行启动的在命令行键入

--rest

具体如下

切换到mongo.ext文件所在目录如D:\mongodb\bin

在访问就行了。

 

 

<1>  insert 操作

             好,数据库有了,下一步就是集合,这里就取集合名为“person”,要注意的就是文档是一个json的扩展(Bson)形式。

 

 <2> find 操作

       我们将数据插入后,肯定是要find出来,不然插了也白插,这里要注意两点:

           ① “_id": 这个字段是数据库默认给我们加的GUID,目的就是保证数据的唯一性。

           ② 严格的按照Bson的形式书写文档,不过也没关系,错误提示还是很强大的。

<3> update操作

      update方法的第一个参数为“查找的条件”,第二个参数为“更新的值”,学过C#,相信还是很好理解的。

<4> remove操作

      remove中如果不带参数将删除所有数据,呵呵,很危险的操作,在mongodb中是一个不可撤回的操作,三思而后行。

一: Insert操作

     上一篇也说过,文档是采用“K-V”格式存储的,如果大家对JSON比较熟悉的话,我相信学mongodb是手到擒来,我们知道JSON里面Value

可能是“字符串”,可能是“数组”,又有可能是内嵌的一个JSON对象,相同的方式也适合于BSON。

      常见的插入操作也就两种形式存在:“单条插入”和“批量插入”。

   

    ①  单条插入

          先前也说了,mongo命令打开的是一个javascript shell。所以js的语法在这里面都行得通,看起来是不是很牛X。 

 ② 批量插入

      这玩意跟“单条插入”的差异相信大家应该知道,由于mongodb中没有提供给shell的“批量插入方法”,没关系,各个语言的driver都打通

了跟mongodb内部的批量插入方法,因为该方法是不可或缺的,如果大家非要模拟下批量插入的话,可以自己写了for循环,里面就是insert。

 

二:Find操作

     日常开发中,我们玩查询,玩的最多的也就是二类:

     ①: >, >=, <, <=, !=, =。

     ②:And,OR,In,NotIn

这些操作在mongodb里面都封装好了,下面就一一介绍:

 <1>"$gt", "$gte", "$lt", "$lte", "$ne", "没有特殊关键字",这些跟上面是一一对应的,举几个例子。

 

<2> "无关键字“, "$or", "$in","$nin" 同样我也是举几个例子

<3> 在mongodb中还有一个特殊的匹配,那就是“正则表达式”,这玩意威力很强的。

<4> 有时查询很复杂,很蛋疼,不过没关系,mongodb给我们祭出了大招,它就是$where,为什么这么说,是因为$where中的value

  就是我们非常熟悉,非常热爱的js来助我们一马平川。

 

三:Update操作

      更新操作无非也就两种,整体更新和局部更新,使用场合相信大家也清楚。

    <1> 整体更新

         不知道大家可还记得,我在上一篇使用update的时候,其实那种update是属于整体更新。

 

 

  <2> 局部更新

        有时候我们仅仅需要更新一个字段,而不是整体更新,那么我们该如何做呢?easy的问题,mongodb中已经给我们提供了两个

   修改器: $inc 和 $set。

   ①  $inc修改器

       $inc也就是increase的缩写,学过sql server 的同学应该很熟悉,比如我们做一个在线用户状态记录,每次修改会在原有的基础上

    自增$inc指定的值,如果“文档”中没有此key,则会创建key,下面的例子一看就懂。

 

 ② $set修改器

      啥也不说了,直接上代码 

 

 

 <3> upsert操作(mysql中replace into和这个一样)

     这个可是mongodb创造出来的“词”,大家还记得update方法的第一次参数是“查询条件”吗?,那么这个upsert操作就是说:如果我

没有查到,我就在数据库里面新增一条,其实这样也有好处,就是避免了我在数据库里面判断是update还是add操作,使用起来很简单

将update的第三个参数设为true即可。

 <4> 批量更新

     在mongodb中如果匹配多条,默认的情况下只更新第一条,那么如果我们有需求必须批量更新,那么在mongodb中实现也是很简单

的,在update的第四个参数中设为true即可。例子就不举了。

 

  今天跟大家分享一下mongodb中比较好玩的知识,主要包括:聚合,游标。

一: 聚合

      常见的聚合操作跟sql server一样,有:count,distinct,group,mapReduce。

<1> count

        count是最简单,最容易,也是最常用的聚合工具,它的使用跟我们C#里面的count使用简直一模一样。

 

 

<2> distinct

       这个操作相信大家也是非常熟悉的,指定了谁,谁就不能重复,直接上图。