mongodb复制集搭建

注:mongodb当前版本是3.4.3

1.准备三个虚拟机做服务器

192.168.168.129:27017
192.168.168.130:27017
192.168.168.131:27017

2.在三台服务器上安装mongodb服务

 详细请见linux安装mongodb(设置非root用户和开机启动)

3.修改配置,在mongodb.conf增加replSet配置,然后启动服务即可

三个服务器的mongodb.conf中都需要加入replSet的指定,它们都属于repl1复制集;

replSet中的S一定要大写!

4.初始化复制集

登入任意一台机器的mongodb执行,因为是全新的复制集,所以可以任意进入一台执行;要是一台有数据,则需要在有数据上执行;要多台有数据则不能初始化。


rs.initiate({_id:'repl1',members:[{_id:1,host:'192.168.168.129:27017'}]})
初始化参数说明:
_id:复制集名称(第一个_id)
members:复制集服务器列表
_id:服务器的唯一ID(数组里_id)
host:服务器主机
我们操作的是192.168.168.129服务器,其中repl1即是复制集名称,和mongodb.conf中保持一致,初始化复制集的第一个服务器将会成为主复制集

通过rs.status()查看复制集状态可以看到,192.168.168.129:27017已被自动分配为primary主复制集了

5.由主复制集添加从复制集


rs.add('192.168.168.130:27017'),增加192.168.168.130为从节点,第一次执行add时报了一个错,这个错说的是找到192.168.168.130服务,是因为防火墙的原因,我们把192.168.168.130防火墙关掉(service iptables stop),当第二次执行add的时候就成功了。

注:为了保证复制集中三个服务器之间正常连接,请保证三个服务器的防火墙都已关闭!

可以看到192.168.168.130:27017成为了secondary节点

6.由主复制集添加仲裁复制集


rs.addArb('192.168.168.131:27017')

可以看到192.168.168.131:27017成为了arbiter节点

7.测试复制集secondary节点数据复制功能

在primary(192.168.168.129:27017)上插入数据:

  1. repl1:PRIMARY> db
  2. test
  3. repl1:PRIMARY> show collections
  4. repl1:PRIMARY>for(var i =0; i <4; i ++){db.user.insert({userName:'gxt'+i,age:i})}
  5. WriteResult({"nInserted":1})
  6. repl1:PRIMARY> show collections
  7. user
  8. repl1:PRIMARY> db.user.find()
  9. {"_id":ObjectId("5912e308e5c3987e4a8131e2"),"userName":"gxt0","age":0}
  10. {"_id":ObjectId("5912e308e5c3987e4a8131e3"),"userName":"gxt1","age":1}
  11. {"_id":ObjectId("5912e308e5c3987e4a8131e4"),"userName":"gxt2","age":2}
  12. {"_id":ObjectId("5912e308e5c3987e4a8131e5"),"userName":"gxt3","age":3}
  13. repl1:PRIMARY>

在secondary上查看是否已经同步:

  1. repl1:SECONDARY> db
  2. test
  3. repl1:SECONDARY> show collections
  4. 2017-05-10T03:14:54.665-0700 E QUERY [thread1]Error: listCollections failed:{
  5. "ok":0,
  6. "errmsg":"not master and slaveOk=false",
  7. "code":13435,
  8. "codeName":"NotMasterNoSlaveOk"
  9. }:
  10. _getErrorWithCode@src/mongo/shell/utils.js:25:13
  11. DB.prototype._getCollectionInfosCommand@src/mongo/shell/db.js:805:1
  12. DB.prototype.getCollectionInfos@src/mongo/shell/db.js:817:19
  13. DB.prototype.getCollectionNames@src/mongo/shell/db.js:828:16
  14. shellHelper.show@src/mongo/shell/utils.js:762:9
  15. shellHelper@src/mongo/shell/utils.js:659:15
  16. @(shellhelp2):1:1
  17. repl1:SECONDARY> rs.slaveOk()
  18. repl1:SECONDARY> show collections
  19. user
  20. repl1:SECONDARY> db.user.find()
  21. {"_id":ObjectId("5912e308e5c3987e4a8131e2"),"userName":"gxt0","age":0}
  22. {"_id":ObjectId("5912e308e5c3987e4a8131e3"),"userName":"gxt1","age":1}
  23. {"_id":ObjectId("5912e308e5c3987e4a8131e4"),"userName":"gxt2","age":2}
  24. {"_id":ObjectId("5912e308e5c3987e4a8131e5"),"userName":"gxt3","age":3}
  25. repl1:SECONDARY>

通过db.user.find()查询到和主复制集上一样的数据,表示数据同步成功!

"errmsg" : "not master and slaveOk=false"错误说明:因为secondary是不允许读写的,如果非要解决,则执行:rs.slaveOk()

在arbiter上查看是否会有数据同步:

  1. repl1:ARBITER> db
  2. test
  3. repl1:ARBITER> show collections
  4. 2017-05-10T03:22:02.554-0700 E QUERY [thread1]Error: listCollections failed:{
  5. "ok":0,
  6. "errmsg":"not master and slaveOk=false",
  7. "code":13435,
  8. "codeName":"NotMasterNoSlaveOk"
  9. }:
  10. _getErrorWithCode@src/mongo/shell/utils.js:25:13
  11. DB.prototype._getCollectionInfosCommand@src/mongo/shell/db.js:805:1
  12. DB.prototype.getCollectionInfos@src/mongo/shell/db.js:817:19
  13. DB.prototype.getCollectionNames@src/mongo/shell/db.js:828:16
  14. shellHelper.show@src/mongo/shell/utils.js:762:9
  15. shellHelper@src/mongo/shell/utils.js:659:15
  16. @(shellhelp2):1:1
  17. repl1:ARBITER> rs.slaveOk()
  18. repl1:ARBITER> show collections
  19. repl1:ARBITER> db.user.find()
  20. Error: error:{
  21. "ok":0,
  22. "errmsg":"node is not in primary or recovering state",
  23. "code":13436,
  24. "codeName":"NotMasterOrSecondary"
  25. }
  26. repl1:ARBITER>

我们可以看到,arbiter并没有进行数据同步,因为仲裁节点只参与投票,不接收数据!

8.测试复制集主从节点故障转移功能

关闭primary节点,查看其它两个节点的情况:

  1. repl1:PRIMARY>use admin
  2. switched to db admin
  3. repl1:PRIMARY> db.shutdownServer()
  4. server should be down...
  5. 2017-05-10T03:27:04.162-0700 I NETWORK [thread1] trying reconnect to 127.0.0.1:27017(127.0.0.1) failed
  6. 2017-05-10T03:27:04.207-0700 I NETWORK [thread1]Socket recv()Connection reset by peer 127.0.0.1:27017
  7. 2017-05-10T03:27:04.208-0700 I NETWORK [thread1]SocketException: remote:(NONE):0 error:9001 socket exception [RECV_ERROR] server [127.0.0.1:27017]
  8. 2017-05-10T03:27:04.208-0700 I NETWORK [thread1] reconnect 127.0.0.1:27017(127.0.0.1) failed failed
  9. >

我们可以看到192.168.168.130:27017从secondary变成了primary,故障转移成功!不过现在这个复制集已没有可以同步数据的从节点了,但我们可以把192.168.168.129:27017重新启动,这时129会变成secondary,这样这个复制集就可以正常工作了。

9.复制集常用方法总结

rs.initiate():复制集初始化,例如:rs.initiate({_id:'repl1',members:[{_id:1,host:'192.168.168.129:27017'}]})
rs.reconfig():重新加载配置文件,例如:

  1. rs.reconfig({_id:'repl1',members:[{_id:1,host:'192.168.168.129:27017'}]},{force:true})当只剩下一个secondary节点时,复制集变得不可用,则可以指定force属性强制将节点变成primary,然后再添加secondary节点

rs.status():查看复制集状态
db.printSlaveReplicationInfo():查看复制情况
rs.conf()/rs.config():查看复制集配置
rs.slaveOk():在当前连接让secondary可以提供读操作
rs.add():增加复制集节点,例如:

  1. rs.add('192.168.168.130:27017')
  2. rs.add({"_id":3,"host":"192.168.168.130:27017","priority":0,"hidden":true})指定hidden属性添加备份节点
  3. rs.add({"_id":3,"host":"192.168.168.130:27017","priority":0,"slaveDelay":60})指定slaveDelay属性添加延迟节点
  4. priority:是优先级,默认为1,如果想手动指定某个节点为primary节点,则把对应节点的priority属性设置为所有节点中最大的一个即可

rs.remove():删除复制集节点,例如:rs.remove('192.168.168.130:27017')
rs.addArb():添加仲裁节点,例如:

  1. rs.addArb('192.168.168.131:27017')或者rs.add({"_id":3,"host":"192.168.168.130:27017","arbiterOnly":true}),仲裁节点,只参与投票,不接收数据

属性说明:

posted @ 2017-05-08 16:14  凌馨儿郡主  阅读(13286)  评论(3编辑  收藏  举报