Mongodb的副本集
副本集-Replica Sets
1.1 简介
MongoDB中的副本集(Replica Set)是一组维护相同数据集的mongod服务。 副本集可提供冗余和高可用性,是所有生产部署的基础。
也可以说,副本集类似于有自动故障恢复功能的主从集群。通俗的讲就是用多台机器进行同一数据的异步同步,从而使多台机器拥有同一数据的多个副本,并且当主库当掉时在不需要用户干预的情况下自动切换其他备份服务器做主库。而且还可以利用副本服务器做只读服务器,实现读写分离,提高负载。
(1)冗余和数据可用性
复制提供冗余并提高数据可用性。 通过在不同数据库服务器上提供多个数据副本,复制可提供一定级别的容错功能,以防止丢失单个数据库服务器。
在某些情况下,复制可以提供增加的读取性能,因为客户端可以将读取操作发送到不同的服务上, 在不同数据中心维护数据副本可以增加分布式应用程序的数据位置和可用性。 您还可以为专用目的维护其他副本,例如灾难恢复,报告或备份。
(2)MongoDB中的复制
副本集是一组维护相同数据集的mongod实例。 副本集包含多个数据承载节点和可选的一个仲裁节点。在承载数据的节点中,一个且仅一个成员被视为主节点,而其他节点被视为次要(从)节点。
主节点接收所有写操作。 副本集只能有一个主要能够确认具有{w:“most”}写入关注的写入; 虽然在某些情况下,另一个mongod实例可能暂时认为自己也是主要的。主要记录其操作日志中的数据集的所有更改,即oplog。
辅助(副本)节点复制主节点的oplog并将操作应用于其数据集,以使辅助节点的数据集反映主节点的数据集。 如果主要人员不在,则符合条件的中学将举行选举以选出新的主要人员。
(3)主从复制和副本集区别
主从集群和副本集最大的区别就是副本集没有固定的“主节点”;整个集群会选出一个“主节点”,当其挂掉后,又在剩下的从节点中选中其他节点为“主节点”,副本集总有一个活跃点(主、primary)和一个或多个备份节点(从、secondary)。
1.2 副本集的三个角色
副本集有两种类型三种角色
两种类型:
主节点( Primary)类型:数据操作的主要连接点,可读写。
次要(辅助、从)节点( Secondaries)类型:数据冗余备份节点,可以读或选举。
三种角色:
主要成员(Primary):主要接收所有写操作。就是主节点。
副本成员(Replicate):从主节点通过复制操作以维护相同的数据集,即备份数据,不可写操作,但可以读操作(但需要配置)。是默认的一种从节点类型。
仲裁者( Arbiter):不保留任何数据的副本,只具有投票选举作用。当然也可以将仲裁服务器维护为副本集的一部分,即副本成员同时也可以是仲裁者。也是一种从节点类型。
关于仲裁者的额外说明:
您可以将额外的mongod实例添加到副本集作为仲裁者。 仲裁者不维护数据集。 仲裁者的目的是通过响应其他副本集成员的心跳和选举请求来维护副本集中的仲裁。 因为它们不存储数据集,所以仲裁器可以是提供副本集仲裁功能的好方法,其资源成本比具有数据集的全功能副本集成员更便宜。
如果您的副本集具有偶数个成员,请添加仲裁者以获得主要选举中的“大多数”投票。 仲裁者不需要专用硬件。仲裁者将永远是仲裁者,而主要人员可能会退出并成为次要人员,而次要人员可能成为选举期间的主要人员。如果你的副本+主节点的个数是偶数,建议加一个仲裁者,形成奇数,容易满足大多数的投票。如果你的副本+主节点的个数是奇数,可以不加仲裁者。
1.3 副本集架构目标
一主一副本一仲裁
1.4 副本集的创建
1.4.1 第一步:创建主节点
建立存放数据和日志的目录
[root@localhost ~]# mkdir -p /mongodb/replica_sets/myrs_27017/log
[root@localhost ~]# mkdir -p /mongodb/replica_sets/myrs_27017/data/db
[root@localhost ~]# tar -xvf mongodb-linux-x86_64-4.0.10.tgz
mongodb-linux-x86_64-4.0.10/THIRD-PARTY-NOTICES.gotools
mongodb-linux-x86_64-4.0.10/README
mongodb-linux-x86_64-4.0.10/THIRD-PARTY-NOTICES
mongodb-linux-x86_64-4.0.10/MPL-2
mongodb-linux-x86_64-4.0.10/LICENSE-Community.txt
mongodb-linux-x86_64-4.0.10/bin/mongodump
mongodb-linux-x86_64-4.0.10/bin/mongorestore
mongodb-linux-x86_64-4.0.10/bin/mongoexport
mongodb-linux-x86_64-4.0.10/bin/mongoimport
mongodb-linux-x86_64-4.0.10/bin/mongostat
mongodb-linux-x86_64-4.0.10/bin/mongotop
mongodb-linux-x86_64-4.0.10/bin/bsondump
mongodb-linux-x86_64-4.0.10/bin/mongofiles
mongodb-linux-x86_64-4.0.10/bin/mongoreplay
mongodb-linux-x86_64-4.0.10/bin/mongod
mongodb-linux-x86_64-4.0.10/bin/mongos
mongodb-linux-x86_64-4.0.10/bin/mongo
mongodb-linux-x86_64-4.0.10/bin/install_compass
[root@localhost ~]# mv mongodb-linux-x86_64-4.0.10 /usr/local/mongodb
[root@localhost ~]# ll
总用量 83012
-rw-------. 1 root root 1242 10月 1 19:39 anaconda-ks.cfg
-rw-r--r--. 1 root root 84996443 10月 12 17:25 mongodb-linux-x86_64-4.0.10.tgz
新建或修改配置文件:
[root@localhost ~]# vim /mongodb/replica_sets/myrs_27017/mongod.conf
[root@localhost ~]# cat /mongodb/replica_sets/myrs_27017/mongod.conf
systemLog:
#MongoDB发送所有日志输出的目标指定为文件
destination: file
#mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径
path: "/mongodb/replica_sets/myrs_27017/log/mongod.log"
#当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。
logAppend: true
storage:
#mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。
dbPath: "/mongodb/replica_sets/myrs_27017/data/db"
journal:
#启用或禁用持久性日志以确保数据文件保持有效和可恢复。
enabled: true
processManagement:
#启用在后台运行mongos或mongod进程的守护进程模式。
fork: true
#指定用于保存mongos或mongod进程的进程ID的文件位置,其中mongos或mongod将写入其PID
pidFilePath: "/mongodb/replica_sets/myrs_27017/log/mongod.pid"
net:
#服务实例绑定所有IP,有副作用,副本集初始化的时候,节点名字会自动设置为本地域名,而不是ip
#bindIpAll: true
#服务实例绑定的IP
bindIp: localhost
#bindIp
#绑定的端口
port: 27017
replication:
#副本集的名称
replSetName: myrs
[root@localhost ~]#
启动节点服务:
[root@localhost ~]# /usr/local/mongodb/bin/mongod -f /mongodb/replica_sets/myrs_27017/mongod.conf
about to fork child process, waiting until server is ready for connections.
forked process: 11308
child process started successfully, parent exiting
1.4.2 第二步:创建副本节点
建立存放数据和日志的目录
[root@localhost ~]# mkdir -p /mongodb/replica_sets/myrs_27018/log
[root@localhost ~]# mkdir -p /mongodb/replica_sets/myrs_27018/data/db
[root@localhost ~]# vim /mongodb/replica_sets/myrs_27018/mongod.conf
[root@localhost ~]# /usr/local/mongodb/bin/mongod -f /mongodb/replica_sets/myrs_27018/mongod.conf
about to fork child process, waiting until server is ready for connections.
forked process: 12236
child process started successfully, parent exiting
[root@localhost ~]# cat /mongodb/replica_sets/myrs_27018/mongod.conf
systemLog:
#MongoDB发送所有日志输出的目标指定为文件
destination: file
#mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径
path: "/mongodb/replica_sets/myrs_27018/log/mongod.log"
#当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。
logAppend: true
storage:
#mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。
dbPath: "/mongodb/replica_sets/myrs_27018/data/db"
journal:
#启用或禁用持久性日志以确保数据文件保持有效和可恢复。
enabled: true
processManagement:
#启用在后台运行mongos或mongod进程的守护进程模式。
fork: true
#指定用于保存mongos或mongod进程的进程ID的文件位置,其中mongos或mongod将写入其PID
pidFilePath: "/mongodb/replica_sets/myrs_27018/log/mongod.pid"
net:
#服务实例绑定所有IP,有副作用,副本集初始化的时候,节点名字会自动设置为本地域名,而不是ip
#bindIpAll: true
#服务实例绑定的IP
bindIp: localhost
#bindIp
#绑定的端口
port: 27018
replication:
#副本集的名称
replSetName: myrs
[root@localhost ~]#
1.4.3 第三步:创建仲裁节点
建立存放数据和日志的目录
[root@localhost ~]# mkdir -p /mongodb/replica_sets/myrs_27019/log \ &
[2] 12894
[root@localhost ~]# mkdir -p /mongodb/replica_sets/myrs_27019/data/db
[2]- 完成 mkdir -p /mongodb/replica_sets/myrs_27019/log \
[root@localhost ~]# vim /mongodb/replica_sets/myrs_27019/mongod.conf
[root@localhost ~]# /usr/local/mongodb/bin/mongod -f /mongodb/replica_sets/myrs_27019/mongod.conf
Unrecognized option: ystemLog.destination
try '/usr/local/mongodb/bin/mongod --help' for more information
[root@localhost ~]# vim /mongodb/replica_sets/myrs_27019/mongod.conf
[root@localhost ~]# /usr/local/mongodb/bin/mongod -f /mongodb/replica_sets/myrs_27019/mongod.conf
about to fork child process, waiting until server is ready for connections.
forked process: 13273
child process started successfully, parent exiting
[root@localhost ~]# cat /mongodb/replica_sets/myrs_27019/mongod.conf
systemLog:
#MongoDB发送所有日志输出的目标指定为文件
destination: file
#mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径
path: "/mongodb/replica_sets/myrs_27019/log/mongod.log"
#当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。
logAppend: true
storage:
#mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。
dbPath: "/mongodb/replica_sets/myrs_27019/data/db"
journal:
#启用或禁用持久性日志以确保数据文件保持有效和可恢复。
enabled: true
processManagement:
#启用在后台运行mongos或mongod进程的守护进程模式。
fork: true
#指定用于保存mongos或mongod进程的进程ID的文件位置,其中mongos或mongod将写入其PID
pidFilePath: "/mongodb/replica_sets/myrs_27019/log/mongod.pid"
net:
#服务实例绑定所有IP,有副作用,副本集初始化的时候,节点名字会自动设置为本地域名,而不是ip
#bindIpAll: true
#服务实例绑定的IP
bindIp: localhost
#bindIp
#绑定的端口
port: 27019
replication:
#副本集的名称
replSetName: myrs
[root@localhost ~]#
1.4.5 第四步:初始化配置副本集和主节点
使用客户端命令连接任意一个节点,但这里尽量要连接主节点(27017节点):
[root@localhost ~]# /usr/local/mongodb/bin/mongo --port=27017
MongoDB shell version v4.0.10
connecting to: mongodb://127.0.0.1:27017/?gssapiServiceName=mongodb
Implicit session: session { "id" : UUID("05371b65-11b8-4fd3-a359-7b5dd88d8103") }
MongoDB server version: 4.0.10
Welcome to the MongoDB shell.
For interactive help, type "help".
For more comprehensive documentation, see
http://docs.mongodb.org/
Questions? Try the support group
http://groups.google.com/group/mongodb-user
Server has startup warnings:
2020-10-12T17:51:28.979+0800 I CONTROL [initandlisten]
2020-10-12T17:51:28.979+0800 I CONTROL [initandlisten] ** WARNING: Access control is not enabled for the database.
2020-10-12T17:51:28.979+0800 I CONTROL [initandlisten] ** Read and write access to data and configuration is unrestricted.
2020-10-12T17:51:28.979+0800 I CONTROL [initandlisten] ** WARNING: You are running this process as the root user, which is not recommended.
2020-10-12T17:51:28.979+0800 I CONTROL [initandlisten]
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten]
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/enabled is 'always'.
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never'
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten]
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/defrag is 'always'.
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never'
2020-10-12T17:51:28.980+0800 I CONTROL [initandlisten]
果,连接上之后,很多命令无法使用,,比如 show dbs 等,必须初始化副本集才行
准备初始化新的副本集:
语法:
rs.initiate(configuration)
Parameter | Type | Description |
---|---|---|
configuration | document | Optional. A document that specifies configuration for the new replica set. If a configuration is not specified, MongoDB uses a default replica set configuration. |
【示例】
使用默认的配置来初始化副本集:
rs.initiate()
执行结果:
> rs.initiate()
{
"info2" : "no configuration specified. Using a default configuration for the set",
"me" : "localhost:27017",
"ok" : 1,
"operationTime" : Timestamp(1602496641, 1),
"$clusterTime" : {
"clusterTime" : Timestamp(1602496641, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
myrs:SECONDARY>
myrs:PRIMARY>
myrs:PRIMARY>
myrs:PRIMARY>
myrs:PRIMARY>
myrs:PRIMARY>
提示:
1)“ok”的值为1,说明创建成功。
2)命令行提示符发生变化,变成了一个从节点角色,此时默认不能读写。稍等片刻,回车,变成主节点。
1.4.6 第五步:查看副本集的配置内容
说明:
返回包含当前副本集配置的文档。
语法:
rs.conf(configuration)
rs.config() 是该方法的别名。
configuration:可选,如果没有配置,则使用默认主节点配置。
【示例】
在27017上执行副本集中当前节点的默认节点配置
myrs:PRIMARY> rs.conf()
{
"_id" : "myrs",
"version" : 1,
"protocolVersion" : NumberLong(1),
"writeConcernMajorityJournalDefault" : true,
"members" : [
{
"_id" : 0,
"host" : "localhost:27017",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
}
],
"settings" : {
"chainingAllowed" : true,
"heartbeatIntervalMillis" : 2000,
"heartbeatTimeoutSecs" : 10,
"electionTimeoutMillis" : 10000,
"catchUpTimeoutMillis" : -1,
"catchUpTakeoverDelayMillis" : 30000,
"getLastErrorModes" : {
},
"getLastErrorDefaults" : {
"w" : 1,
"wtimeout" : 0
},
"replicaSetId" : ObjectId("5f84288139869ebb123f25db")
}
}
说明:
1) "_id" : "myrs" :副本集的配置数据存储的主键值,默认就是副本集的名字
2) "members" :副本集成员数组,此时只有一个: "host" : "180.76.159.126:27017" ,该成员不是仲裁节点: "arbiterOnly" : false ,优先级(权重值): "priority" : 1,
3) "settings" :副本集的参数配置。
提示:副本集配置的查看命令,本质是查询的是 system.replset 的表中的数据:
myrs:PRIMARY> use local
switched to db local
myrs:PRIMARY> how collections
2020-10-12T20:22:22.925+0800 E QUERY [js] SyntaxError: missing ; before statement @(shell):1:4
myrs:PRIMARY> show collections
oplog.rs
replset.election
replset.minvalid
replset.oplogTruncateAfterPoint
startup_log
system.replset
system.rollback.id
myrs:PRIMARY> db.system.replset.find()
{ "_id" : "myrs", "version" : 1, "protocolVersion" : NumberLong(1), "writeConcernMajorityJournalDefault" : true, "members" : [ { "_id" : 0, "host" : "localhost:27017", "arbiterOnly" : false, "buildIndexes" : true, "hidden" : false, "priority" : 1, "tags" : { }, "slaveDelay" : NumberLong(0), "votes" : 1 } ], "settings" : { "chainingAllowed" : true, "heartbeatIntervalMillis" : 2000, "heartbeatTimeoutSecs" : 10, "electionTimeoutMillis" : 10000, "catchUpTimeoutMillis" : -1, "catchUpTakeoverDelayMillis" : 30000, "getLastErrorModes" : { }, "getLastErrorDefaults" : { "w" : 1, "wtimeout" : 0 }, "replicaSetId" : ObjectId("5f84288139869ebb123f25db") } }
1.4.7 第六步:查看副本集状态
检查副本集状态。
说明:
返回包含状态信息的文档。此输出使用从副本集的其他成员发送的心跳包中获得的数据反映副本集的当
前状态。
语法:
rs.status()
【示例】
在27017上查看副本集状态:
myrs:PRIMARY> rs.status()
{
"set" : "myrs",
"date" : ISODate("2020-10-12T12:22:54.806Z"),
"myState" : 1,
"term" : NumberLong(1),
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"heartbeatIntervalMillis" : NumberLong(2000),
"optimes" : {
"lastCommittedOpTime" : {
"ts" : Timestamp(1602505374, 1),
"t" : NumberLong(1)
},
"readConcernMajorityOpTime" : {
"ts" : Timestamp(1602505374, 1),
"t" : NumberLong(1)
},
"appliedOpTime" : {
"ts" : Timestamp(1602505374, 1),
"t" : NumberLong(1)
},
"durableOpTime" : {
"ts" : Timestamp(1602505374, 1),
"t" : NumberLong(1)
}
},
"lastStableCheckpointTimestamp" : Timestamp(1602505344, 1),
"members" : [
{
"_id" : 0,
"name" : "localhost:27017",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
"uptime" : 9087,
"optime" : {
"ts" : Timestamp(1602505374, 1),
"t" : NumberLong(1)
},
"optimeDate" : ISODate("2020-10-12T12:22:54Z"),
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"infoMessage" : "",
"electionTime" : Timestamp(1602496641, 2),
"electionDate" : ISODate("2020-10-12T09:57:21Z"),
"configVersion" : 1,
"self" : true,
"lastHeartbeatMessage" : ""
}
],
"ok" : 1,
"operationTime" : Timestamp(1602505374, 1),
"$clusterTime" : {
"clusterTime" : Timestamp(1602505374, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
说明:
1) "set" : "myrs" :副本集的名字
2) "myState" : 1:说明状态正常
3) "members" :副本集成员数组,此时只有一个: "name" : "localhost:27017" ,该成员的角色是 "stateStr" : "PRIMARY", 该节点是健康的: "health" : 1 。
1.4.8 第四步:添加副本从节点
在主节点添加从节点,将其他成员加入到副本集
语法:
rs.add(host, arbiterOnly)
Parameter | Type | Description |
---|---|---|
host | string or document | 要添加到副本集的新成员。 指定为字符串或配置文档:1)如 果是一个字符串,则需要指定新成员的主机名和可选的端口 号;2)如果是一个文档,请指定在members数组中找到的副 本集成员配置文档。 您必须在成员配置文档中指定主机字段。 有关文档配置字段的说明,详见下方文档:“主机成员的配置文 档” |
arbiterOnly | boolean | 可选的。 仅在 |
示例】
将27018的副本节点添加到副本集中:
myrs:PRIMARY> rs.add("localhost:27018")
{
"ok" : 1,
"operationTime" : Timestamp(1602505461, 1),
"$clusterTime" : {
"clusterTime" : Timestamp(1602505461, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
说明:
1) "ok" : 1 :说明添加成功。
查看副本集状态:
myrs:PRIMARY> rs.status()
{
"set" : "myrs",
"date" : ISODate("2020-10-12T12:24:40.502Z"),
"myState" : 1,
"term" : NumberLong(1),
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"heartbeatIntervalMillis" : NumberLong(2000),
"optimes" : {
"lastCommittedOpTime" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
},
"readConcernMajorityOpTime" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
},
"appliedOpTime" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
},
"durableOpTime" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
}
},
"lastStableCheckpointTimestamp" : Timestamp(1602505461, 1),
"members" : [
{
"_id" : 0,
"name" : "localhost:27017",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
"uptime" : 9193,
"optime" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
},
"optimeDate" : ISODate("2020-10-12T12:24:34Z"),
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"infoMessage" : "",
"electionTime" : Timestamp(1602496641, 2),
"electionDate" : ISODate("2020-10-12T09:57:21Z"),
"configVersion" : 2,
"self" : true,
"lastHeartbeatMessage" : ""
},
{
"_id" : 1,
"name" : "localhost:27018",
"health" : 1,
"state" : 2,
"stateStr" : "SECONDARY",
"uptime" : 18,
"optime" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
},
"optimeDurable" : {
"ts" : Timestamp(1602505474, 1),
"t" : NumberLong(1)
},
"optimeDate" : ISODate("2020-10-12T12:24:34Z"),
"optimeDurableDate" : ISODate("2020-10-12T12:24:34Z"),
"lastHeartbeat" : ISODate("2020-10-12T12:24:39.546Z"),
"lastHeartbeatRecv" : ISODate("2020-10-12T12:24:39.823Z"),
"pingMs" : NumberLong(0),
"lastHeartbeatMessage" : "",
"syncingTo" : "localhost:27017",
"syncSourceHost" : "localhost:27017",
"syncSourceId" : 0,
"infoMessage" : "",
"configVersion" : 2
}
],
"ok" : 1,
"operationTime" : Timestamp(1602505474, 1),
"$clusterTime" : {
"clusterTime" : Timestamp(1602505474, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
说明:
1) "name" : "localhost:27018" 是第二个节点的名字,其角色是 "stateStr" :"SECONDARY"
1.4.9 第五步:添加仲裁从节点
添加一个仲裁节点到副本集
语法:
rs.addArb(host)
将27019的仲裁节点添加到副本集中:
myrs:PRIMARY> rs.addArb("localhost:27019")
{
"ok" : 1,
"operationTime" : Timestamp(1602505564, 2),
"$clusterTime" : {
"clusterTime" : Timestamp(1602505564, 2),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
说明:
1) "ok" : 1 :说明添加成功。
查看副本集状态:
myrs:PRIMARY> rs.status()
{
"set" : "myrs",
"date" : ISODate("2020-10-12T12:26:27.106Z"),
"myState" : 1,
"term" : NumberLong(1),
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"heartbeatIntervalMillis" : NumberLong(2000),
"optimes" : {
"lastCommittedOpTime" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
},
"readConcernMajorityOpTime" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
},
"appliedOpTime" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
},
"durableOpTime" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
}
},
"lastStableCheckpointTimestamp" : Timestamp(1602505564, 2),
"members" : [
{
"_id" : 0,
"name" : "localhost:27017",
"health" : 1,
"state" : 1,
"stateStr" : "PRIMARY",
"uptime" : 9300,
"optime" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
},
"optimeDate" : ISODate("2020-10-12T12:26:24Z"),
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"infoMessage" : "",
"electionTime" : Timestamp(1602496641, 2),
"electionDate" : ISODate("2020-10-12T09:57:21Z"),
"configVersion" : 3,
"self" : true,
"lastHeartbeatMessage" : ""
},
{
"_id" : 1,
"name" : "localhost:27018",
"health" : 1,
"state" : 2,
"stateStr" : "SECONDARY",
"uptime" : 125,
"optime" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
},
"optimeDurable" : {
"ts" : Timestamp(1602505584, 1),
"t" : NumberLong(1)
},
"optimeDate" : ISODate("2020-10-12T12:26:24Z"),
"optimeDurableDate" : ISODate("2020-10-12T12:26:24Z"),
"lastHeartbeat" : ISODate("2020-10-12T12:26:26.804Z"),
"lastHeartbeatRecv" : ISODate("2020-10-12T12:26:25.818Z"),
"pingMs" : NumberLong(0),
"lastHeartbeatMessage" : "",
"syncingTo" : "localhost:27017",
"syncSourceHost" : "localhost:27017",
"syncSourceId" : 0,
"infoMessage" : "",
"configVersion" : 3
},
{
"_id" : 2,
"name" : "localhost:27019",
"health" : 1,
"state" : 7,
"stateStr" : "ARBITER",
"uptime" : 22,
"lastHeartbeat" : ISODate("2020-10-12T12:26:26.804Z"),
"lastHeartbeatRecv" : ISODate("2020-10-12T12:26:26.818Z"),
"pingMs" : NumberLong(0),
"lastHeartbeatMessage" : "",
"syncingTo" : "",
"syncSourceHost" : "",
"syncSourceId" : -1,
"infoMessage" : "",
"configVersion" : 3
}
],
"ok" : 1,
"operationTime" : Timestamp(1602505584, 1),
"$clusterTime" : {
"clusterTime" : Timestamp(1602505584, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
说明:
1) "name" : "localhost:27019" 是第二个节点的名字,其角色是 "stateStr" : "ARBITER"
1.5 副本集的数据读写操作
目标:测试三个不同角色的节点的数据读写情况。
登录主节点27017,写入和读取数据:
myrs:PRIMARY> use articledb
switched to db articledb
myrs:PRIMARY> db
articledb
myrs:PRIMARY> db.comment.insert({"articleid":"100000","content":"今天天气真好,阳光明媚","userid":"1001","nickname":"Rose","createdatetime":new Date()})
WriteResult({ "nInserted" : 1 })
myrs:PRIMARY> db.comment.find()
{ "_id" : ObjectId("5f844c02d75b8f0f5671bf36"), "articleid" : "100000", "content" : "今天天气真好,阳光明媚", "userid" : "1001", "nickname" : "Rose", "createdatetime" : ISODate("2020-10-12T12:28:50.774Z") }
myrs:PRIMARY>
登录从节点27018
[root@localhost ~]# /usr/local/mongodb/bin/mongo --port 27018
MongoDB shell version v4.0.10
connecting to: mongodb://127.0.0.1:27018/?gssapiServiceName=mongodb
Implicit session: session { "id" : UUID("bc619f58-4a9a-4863-99da-627459fc6f7f") }
MongoDB server version: 4.0.10
Server has startup warnings:
2020-10-12T17:54:00.894+0800 I CONTROL [initandlisten]
2020-10-12T17:54:00.894+0800 I CONTROL [initandlisten] ** WARNING: Access control is not enabled for the database.
2020-10-12T17:54:00.894+0800 I CONTROL [initandlisten] ** Read and write access to data and configuration is unrestricted.
2020-10-12T17:54:00.894+0800 I CONTROL [initandlisten] ** WARNING: You are running this process as the root user, which is not recommended.
2020-10-12T17:54:00.894+0800 I CONTROL [initandlisten]
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten]
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/enabled is 'always'.
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never'
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten]
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/defrag is 'always'.
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never'
2020-10-12T17:54:00.895+0800 I CONTROL [initandlisten]
myrs:SECONDARY> show dbs;
2020-10-12T20:29:40.653+0800 E QUERY [js] Error: listDatabases failed:{
"operationTime" : Timestamp(1602505774, 1),
"ok" : 0,
"errmsg" : "not master and slaveOk=false",
"code" : 13435,
"codeName" : "NotMasterNoSlaveOk",
"$clusterTime" : {
"clusterTime" : Timestamp(1602505774, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
} :
_getErrorWithCode@src/mongo/shell/utils.js:25:13
Mongo.prototype.getDBs@src/mongo/shell/mongo.js:139:1
shellHelper.show@src/mongo/shell/utils.js:882:13
shellHelper@src/mongo/shell/utils.js:766:15
@(shellhelp2):1:1
发现,不能读取集合的数据。当前从节点只是一个备份,不是奴隶节点,无法读取数据,写当然更不行。
因为默认情况下,从节点是没有读写权限的,可以增加读的权限,但需要进行设置。
设置读操作权限:
说明:
设置为奴隶节点,允许在从成员上运行读的操作
语法:
rs.slaveOk()
提示:
该命令是 db.getMongo().setSlaveOk() 的简化命令。
【示例】
在27018上设置作为奴隶节点权限,具备读权限
myrs:SECONDARY> how dbs;
2020-10-12T20:30:10.502+0800 E QUERY [js] SyntaxError: missing ; before statement @(shell):1:4
myrs:SECONDARY> show dbs;
admin 0.000GB
articledb 0.000GB
config 0.000GB
local 0.000GB
myrs:SECONDARY> se articledb
2020-10-12T20:30:20.606+0800 E QUERY [js] SyntaxError: missing ; before statement @(shell):1:3
myrs:SECONDARY> use articledb
switched to db articledb
myrs:SECONDARY> show collections
comment
myrs:SECONDARY> db.comment.find()
{ "_id" : ObjectId("5f844c02d75b8f0f5671bf36"), "articleid" : "100000", "content" : "今天天气真好,阳光明媚", "userid" : "1001", "nickname" : "Rose", "createdatetime" : ISODate("2020-10-12T12:28:50.774Z") }
myrs:SECONDARY> db.comment.insert({"articleid":"100002","content":"今天天气真好,阳光明媚","userid":"1001","nickname":"Rose","createdatetime":new Date()})
WriteCommandError({
"operationTime" : Timestamp(1602505854, 1),
"ok" : 0,
"errmsg" : "not master",
"code" : 10107,
"codeName" : "NotMaster",
"$clusterTime" : {
"clusterTime" : Timestamp(1602505854, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
})
myrs:SECONDARY>
仲裁者节点,不存放任何业务数据的,可以登录查看
[root@localhost ~]# /usr/local/mongodb/bin/mongo --port 27019
MongoDB shell version v4.0.10
connecting to: mongodb://127.0.0.1:27019/?gssapiServiceName=mongodb
Implicit session: session { "id" : UUID("8f6cfc15-cd7b-43d0-b13e-e2a9de81e017") }
MongoDB server version: 4.0.10
Server has startup warnings:
2020-10-12T17:56:50.460+0800 I CONTROL [initandlisten]
2020-10-12T17:56:50.460+0800 I CONTROL [initandlisten] ** WARNING: Access control is not enabled for the database.
2020-10-12T17:56:50.460+0800 I CONTROL [initandlisten] ** Read and write access to data and configuration is unrestricted.
2020-10-12T17:56:50.460+0800 I CONTROL [initandlisten] ** WARNING: You are running this process as the root user, which is not recommended.
2020-10-12T17:56:50.460+0800 I CONTROL [initandlisten]
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten]
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/enabled is 'always'.
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never'
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten]
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/defrag is 'always'.
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never'
2020-10-12T17:56:50.461+0800 I CONTROL [initandlisten]
myrs:ARBITER> rs.slaveOk()
myrs:ARBITER> show dbs
local 0.000GB
myrs:ARBITER> use local
switched to db local
myrs:ARBITER> show collections
replset.minvalid
replset.oplogTruncateAfterPoint
startup_log
system.replset
system.rollback.id
myrs:ARBITER>
发现,只存放副本集配置等数据。
1.6 主节点的选举原则
MongoDB在副本集中,会自动进行主节点的选举,主节点选举的触发条件:
1) 主节点故障
2) 主节点网络不可达(默认心跳信息为10秒)
3) 人工干预(rs.stepDown(600))
一旦触发选举,就要根据一定规则来选主节点。
选举规则是根据票数来决定谁获胜:
票数最高,且获得了“大多数”成员的投票支持的节点获胜。
“大多数”的定义为:假设复制集内投票成员数量为N,则大多数为 N/2 + 1。例如:3个投票成员,则大多数的值是2。当复制集内存活成员数量不足大多数时,整个复制集将无法选举出Primary,复制集将无法提供写服务,处于只读状态。
若票数相同,且都获得了“大多数”成员的投票支持的,数据新的节点获胜。数据的新旧是通过操作日志oplog来对比的。
在获得票数的时候,优先级(priority)参数影响重大。可以通过设置优先级(priority)来设置额外票数。优先级即权重,取值为0-1000,相当于可额外增加
0-1000的票数,优先级的值越大,就越可能获得多数成员的投票(votes)数。指定较高的值可使成员更有资格成为主要成员,更低的值可使成员更不符合条件。
默认情况下,优先级的值是1
myrs:PRIMARY> rs.conf()
{
"_id" : "myrs",
"version" : 3,
"protocolVersion" : NumberLong(1),
"writeConcernMajorityJournalDefault" : true,
"members" : [
{
"_id" : 0,
"host" : "localhost:27017",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
},
{
"_id" : 1,
"host" : "localhost:27018",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
},
{
"_id" : 2,
"host" : "localhost:27019",
"arbiterOnly" : true,
"buildIndexes" : true,
"hidden" : false,
"priority" : 0,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
}
],
"settings" : {
"chainingAllowed" : true,
"heartbeatIntervalMillis" : 2000,
"heartbeatTimeoutSecs" : 10,
"electionTimeoutMillis" : 10000,
"catchUpTimeoutMillis" : -1,
"catchUpTakeoverDelayMillis" : 30000,
"getLastErrorModes" : {
},
"getLastErrorDefaults" : {
"w" : 1,
"wtimeout" : 0
},
"replicaSetId" : ObjectId("5f84288139869ebb123f25db")
}
}
myrs:PRIMARY>
可以看出,主节点和副本节点的优先级各为1,即,默认可以认为都已经有了一票。但选举节点,优先级是0,(要注意是,官方说了,选举节点的优先级必须是0,不能是别的值。即不具备选举权,但具有投票权)
【了解】修改优先级
比如,下面提升从节点的优先级:
myrs:PRIMARY> cfg=rs.conf()
{
"_id" : "myrs",
"version" : 3,
"protocolVersion" : NumberLong(1),
"writeConcernMajorityJournalDefault" : true,
"members" : [
{
"_id" : 0,
"host" : "localhost:27017",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
},
{
"_id" : 1,
"host" : "localhost:27018",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
},
{
"_id" : 2,
"host" : "localhost:27019",
"arbiterOnly" : true,
"buildIndexes" : true,
"hidden" : false,
"priority" : 0,
"tags" : {
},
"slaveDelay" : NumberLong(0),
"votes" : 1
}
],
"settings" : {
"chainingAllowed" : true,
"heartbeatIntervalMillis" : 2000,
"heartbeatTimeoutSecs" : 10,
"electionTimeoutMillis" : 10000,
"catchUpTimeoutMillis" : -1,
"catchUpTakeoverDelayMillis" : 30000,
"getLastErrorModes" : {
},
"getLastErrorDefaults" : {
"w" : 1,
"wtimeout" : 0
},
"replicaSetId" : ObjectId("5f84288139869ebb123f25db")
}
}
myrs:PRIMARY> cfg.members[1].priority=2
2
myrs:PRIMARY> rs.reconfig(cfg)
{
"ok" : 1,
"operationTime" : Timestamp(1602509361, 1),
"$clusterTime" : {
"clusterTime" : Timestamp(1602509361, 1),
"signature" : {
"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
"keyId" : NumberLong(0)
}
}
}
myrs:PRIMARY>
1.7 故障测试
1.7.1 副本节点故障测试
关闭27018副本节点:
发现,主节点和仲裁节点对27018的心跳失败。因为主节点还在,因此,没有触发投票选举。
如果此时,在主节点写入数据。
再启动从节点,会发现,主节点写入的数据,会自动同步给从节点。
1.7.2主节点故障测试
关闭27017节点
发现,从节点和仲裁节点对27017的心跳失败,当失败超过10秒,此时因为没有主节点了,会自动发起投票。
而副本节点只有27018,因此,候选人只有一个就是27018,开始投票。
27019向27018投了一票,27018本身自带一票,因此共两票,超过了“大多数”
27019是仲裁节点,没有选举权,27018不向其投票,其票数是0.
最终结果,27018成为主节点。具备读写功能。
在27018写入数据查看。
再启动 27017节点,发现27017变成了从节点,27018仍保持主节点。
登录27017节点,发现是从节点了,数据自动从27018同步。
从而实现了高可用。
1.7.3 仲裁节点和主节点故障
先关掉仲裁节点27019,
关掉现在的主节点27018
登录27017后,发现,27017仍然是从节点,副本集中没有主节点了,导致此时,副本集是只读状态,无法写入。
为啥不选举了?因为27017的票数,没有获得大多数,即没有大于等于2,它只有默认的一票(优先级是1)
如果要触发选举,随便加入一个成员即可。
如果只加入 27019仲裁节点成员,则主节点一定是27017,因为没得选了,仲裁节点不参与选举,但参与投票。(不演示)
如果只加入 27018节点,会发起选举。因为27017和27018都是两票,则按照谁数据新,谁当主节点。
1.7.4 仲裁节点和从节点故障
先关掉仲裁节点27019,
关掉现在的副本节点27018
10秒后,27017主节点自动降级为副本节点。(服务降级)
副本集不可写数据了,已经故障了。