MongoDB优化之二：常见优化方法2

连接池xml配置：

<!-- mongodb访问实例工程类-->
    <mongo:mongo host="${mongo.location}" port="${mongo.port}">
    <mongo:options
    connections-per-host="100"
   threads-allowed-to-block-for-connection-multiplier="10"
   connect-timeout="10000"
   max-wait-time="120000"
   auto-connect-retry="false"
   socket-keep-alive="false"
   socket-timeout="0"
   slave-ok="false"
   write-number="1"
   write-timeout="0"
   write-fsync="true"
    />
    </mongo:mongo>
<mongo:db-factory mongo-ref="mongo"
   dbname="${mongo.dbName}" username="${mongo.username}" password="${mongo.password}" id="mongoDbFactory" />
<bean id="mongoTemplate" class="org.springframework.data.mongodb.core.MongoTemplate">
   <constructor-arg name="mongoDbFactory" ref="mongoDbFactory" />
</bean>

各个参数说明：

#对mongo实例来说，每个host允许链接的最大链接数,这些链接空闲时会放入池中,如果链接被耗尽，任何请求链接的操作会被阻塞等待链接可用,推荐配置10
connectionsPerHost=10
#当链接空闲时,空闲线程池中最大链接数
minPoolsSize=5
#此参数跟connectionsPerHost的乘机为一个线程变为可用的最大阻塞数，超过此乘机数之后的所有线程将及时获取一个异常.eg.connectionsPerHost=10 and threadsAllowedToBlockForConnectionMultiplier=5,最多50个线程等级一个链接，推荐配置为5
threadsAllowedToBlockForConnectionMultiplier=5
#一个线程等待链接可用的最大等待毫秒数，0表示不等待，负数表示等待时间不确定，推荐配置120000
maxWaitTime=120000
#链接超时的毫秒数,0表示不超时,此参数只用在新建一个新链接时，推荐配置10,000.
connectTimeout=10000
#此参数表示socket I/O读写超时时间,推荐为不超时，即 0 Socket.setSoTimeout(int)
socketTimeout=0
#该标志用于控制socket保持活动的功能，通过防火墙保持连接活着
socketKeepAlive=false
#true:假如链接不能建立时,驱动将重试相同的server,有最大的重试次数,默认为15次,这样可以避免一些server因为一些阻塞操作零时down而驱动抛出异常,这个对平滑过度到一个新的master,也是很有用的,注意:当集群为复制集时,驱动将在这段时间里,尝试链接到旧的master上,而不会马上链接到新master上
#false 当在进行socket读写时,不会阻止异常抛出,驱动已经有自动重建破坏链接和重试读操作. 推荐配置false
autoConnectRetry=false
#重新打开链接到相同server的最大毫秒数,推荐配置为0，如果 autoConnectRetry=true,表示时间为15s
#com.jd.mongodbclient2.mongo.JDClientMongo.maxAutoConnectRetryTime=false
#表示当没有手动关闭游标时,是否有一个自动释放游标对象的方法,如果你总是很小心的关闭游标,则可以将其设为false 推荐配置true

#com.jd.mongodbclient2.mongo.JDClientMongo.cursorFinalizerEnabled=true

#安全模式

com.jd.mongodbclient2.driver.MongoDBDriver.safe=true
#为true表示读写分离

com.jd.mongodbclient2.driver.MongoDBDriver.slaveOk=false

1. MongoClientOptions中的连接池配置:

配置如下:

connectionPoolSettings = ConnectionPoolSettings.builder()
                                                       .minSize(getMinConnectionsPerHost())
                                                       .maxSize(getConnectionsPerHost())
                                                       .maxWaitQueueSize(getThreadsAllowedToBlockForConnectionMultiplier()
                                                                         * getConnectionsPerHost())
                                                       .maxWaitTime(getMaxWaitTime(), MILLISECONDS)
                                                       .maxConnectionIdleTime(getMaxConnectionIdleTime(), MILLISECONDS)
                                                       .maxConnectionLifeTime(getMaxConnectionLifeTime(), MILLISECONDS)
                                                       .build();

minSize: 线程池空闲时保持的最小连接数, 默认是0.

maxSize: 线程池允许的最大连接数,默认是100.

maxWaitQueueSize: 线程池等待队列的大小, 默认是500.

maxWaitTime: 线程等待连接变为可用的最长时间.默认为2分钟. 值为0意味着它不会等待. 负值意味着它将无限期地等待

maxConnectionIdleTime: 线程池中连接的最大空闲时间, 0标志Udine空闲时间没有限制,超过这个时间会被关闭.

maxConnectionLifeTime: 线程池中连接的最长生存时间. 0表示没有限制. 超过寿命的会被关闭,必要时通过新连接进行替换.

2. MongoClientOptions初始化

mongodb驱动中 MongoClientOptions 使用Buidler模式配置,有关所有属性的默认值,都是在Builder里边配置的.

关于Builder 的配置如下:

    public static class Builder {
        private String description;
        private String applicationName;
        //读取偏好, 这里默认的是从主节点读取.
        private ReadPreference readPreference = ReadPreference.primary();
        //使用服务器默认的写关注?
        private WriteConcern writeConcern = WriteConcern.ACKNOWLEDGED;
        //使用服务的默认读关注,默认是local
        private ReadConcern readConcern = ReadConcern.DEFAULT;
        private CodecRegistry codecRegistry = MongoClient.getDefaultCodecRegistry();
        private final List<CommandListener> commandListeners = new ArrayList<CommandListener>();
        private final List<ClusterListener> clusterListeners = new ArrayList<ClusterListener>();
        private final List<ServerListener> serverListeners = new ArrayList<ServerListener>();
        private final List<ServerMonitorListener> serverMonitorListeners = new ArrayList<ServerMonitorListener>();

        private int minConnectionsPerHost;
        private int maxConnectionsPerHost = 100;
        private int threadsAllowedToBlockForConnectionMultiplier = 5;
        //设置服务器选择超时（以毫秒为单位），它定义驱动程序在抛出异常之前等待服务器选择成功的时间
        //值为0表示如果没有可用的服务器，它将立即超时。 负值意味着无限期等待
        private int serverSelectionTimeout = 1000 * 30;
        //线程等待连接变为可用的最长时间
        private int maxWaitTime = 1000 * 60 * 2;
        // 线程池中连接的最大空闲时间
        private int maxConnectionIdleTime;
        private int maxConnectionLifeTime;
        //连接超时时间,必须大于0
        private int connectTimeout = 1000 * 10;
        //socket超时时间
        private int socketTimeout = 0;
        //socket是否保活
        private boolean socketKeepAlive = false;
        private boolean sslEnabled = false;
        private boolean sslInvalidHostNameAllowed = false;
        private boolean alwaysUseMBeans = false;
        //设置心跳频率。 这是驱动程序将尝试确定群集中每个服务器的当前状态的频率。 默认值为10,000毫秒
        private int heartbeatFrequency = 10000;
        //设置最小心跳频率。 如果驱动程序必须经常重新检查服务器的可用性，它将至少在上一次检查后等待很长时间，以避免浪费精力。 默认值为500毫秒。
        private int minHeartbeatFrequency = 500;
        //设置用于集群心跳的连接的连接超时
        private int heartbeatConnectTimeout = 20000;
        //设置用于集群心跳的连接的套接字超时
        private int heartbeatSocketTimeout = 20000;
        //本地阈值
        private int localThreshold = 15;

        private String requiredReplicaSetName;
        private DBDecoderFactory dbDecoderFactory = DefaultDBDecoder.FACTORY;
        private DBEncoderFactory dbEncoderFactory = DefaultDBEncoder.FACTORY;
        private SocketFactory socketFactory;
        private boolean cursorFinalizerEnabled = true;
...}

3. 需要关心的配置

这里就因人而异了, 我这列出比较重要的几个配置,具体的值看业务场景.

3.1 读写相关

这应该是程序最应该关注的配置了,读关注,写关注,读取偏好.

//读取偏好, 首先从从节点读取.
private ReadPreference readPreference = ReadPreference.secondaryPreferred();
//写关注为1 ,写入主节点即返回.
private WriteConcern writeConcern = WriteConcern.W1;
//使用服务的默认读关注,默认是local(决定到某个读取数据时，能读到什么样的数据)
private ReadConcern readConcern = ReadConcern.LOCAL;

3.2 线程池配置

//线程池空闲时保持的最小连接数

minConnectionsPerHost=20

//线程池允许的最大连接数

connectionsPerHost=100

//connectionsPerHost* 5 =最大队列数

threadsAllowedToBlockForConnectionMultiplier=5

//线程池中连接的最大空闲时间,5分钟

maxConnectionIdleTime = 5*60*1000

// 线程池中连接的最长生存时间,采用默认值

maxConnectionLifeTime

3.3 连接配置

//设置服务器选择超时（以毫秒为单位），它定义驱动程序在抛出异常之前等待服务器选择成功的时间
//值为0表示如果没有可用的服务器，它将立即超时。负值意味着无限期等待
private int serverSelectionTimeout = 1000 * 30;

//连接超时时间,必须大于0
private int connectTimeout = 1000 * 5;

//线程等待连接变为可用的最长时间.

maxWaitTime=6000

这里建议这两个参数: maxWaitTime,connectTimeout,根据公司具体的业务来..

四个方面进行 cpu/io 方面的优化处理：

1.集群架构上进行读写分离。所有查询优先考虑在从库上读取，写操作在主库上执行。避免主库混合读写压力过大，也减少主库上读写记录的锁冲突。

connection string中readPreference 设置成secondarypreferred，C++ 驱动版本升级为3.1.3 mongo-cxx-driver（驱动升级，读写分离才生效）。

2.热表msg_traces 索引优化

针对该慢查询创建联合索引 {"_id": 1, "account": 1, "app_key": 1, "s_pc": 1}。

3.mongodb 历史数据归档和删除

和开发同事沟通，根据实际业务需求，保留msgs、msg_traces 集合中一年左右的文档。在timestamp 字段上创建TTL索引。设置文档的过期时间为 3153600秒（365*24*3600）。

db.msgs.createIndex( { "timestamp ": 1 }, { expireAfterSeconds: 3153600 },{background: true} )

db.msg_traces.createIndex( { "timestamp ": 1 }, { expireAfterSeconds: 3153600 },{background: true} )

mongodb TTL索引将每隔60秒对过期数据执行一次删除操作。删除操作的持续实际取决于mongod 实例的负载。

4 .journal 日志的 commitIntervalMs 参数调整。

从默认的100ms调大到500ms。

目前通过读写分离和索引优化之后，原来分片1在业务高峰期间的cpu load 值由最高值250降低到5以内，优化效果非常明显。

mongodb 分片集群优化思路总结：

分片集群中出现某个分片负载特别高的情况。（往往是某个分片负载高，如果是多个分片节点负载都高，则需要逐个进行分析）

第一步：

首先通过top、iostat、vmstat、mongostat 等工具了解系统大致并发负载和读写比例，观察系统具体瓶颈所在。

第二步：

如果负载只是集中出现在某一个节点上，则通过 mongotop 工具先分析该mongodb实例的热点表是哪些并记录下来。

第三步：

通过 mlogfilter / mloginfo 工具分析业务高峰期间出现的TOP10 慢查询。

第四步：

定位需要优化的目标表,并进行查询优化。

通常第二步和第三步会出现很多相同的表。因为热点数据表和慢查询表往往存在相同的一些表。这些表就是我们需要优化的目标。

mongodb 分片表的优化大致从以下几方面着手：

1.查看表分片键、数据分布、数据总量、数据占用空间等信息。着重看数据分片键设置是否合理、数据分布是否均匀；

2.mloginfo 工具打印出来的慢查询信息中有每个慢查询的查询条件。确认慢查询表上是否有合适的索引满足查询条件执行。需要结合explain() 分析慢查询的具体执行计划。

3.选取业务高峰阶段的mongodb实例原始日志，搜索慢查询表相关的原始查询语句。记录这些原始查询语句，方便后续与开发同事沟通，看能否从业务场景上进行相应的优化。

4.对于日志、事件、会话信息等日志类型的表，可以按照业务需求，根据事件字段，只保留一定时间内的有效数据。通常这要与开发业务沟通清楚。确认保留时间后，可以利用mongodb TTL索引特性，在特定时间字段上创建索引，设置记录过期时限。

第五步：

架构上做读写分离优化

如果在第三步找出来的 TOP10 慢查询不少是能有效利用索引的简单查询，正常情况下，执行应该很快（200ms之内）。

则需要考虑在架构上做读写分离的优化。因为热点表高并发的读写会让cpu 忙不过来，导致原本正常的查询都出现阻塞。

总之，mongodb 优化关键之处是找出系统瓶颈和问题根源。定位出需要优化的目标表后，简单地加个索引或者做个读写分离，性能问题往往就迎刃而解。

这个和医生看病颇为相似，通过望闻问切和各种医疗检验设备所反馈的数据和报告，再依据丰富的临床经验诊断出病因所在。找出病因后，开什么方子用什么药就是水到渠成的事了。当然，医生看病比给数据库做性能诊断复杂多了，误诊几率也不小。而且，数据库性能优化没找准原因还有不少试错的机会，但是医生试错成本就比较高了。所以当个好医生貌似比做个好DBA更难！

以上插了些题外话。优化上过程中，也需要和开发同事保持有效沟通。当我们理解慢查询产生的业务场景后，有时让开发同事配合做个简单的功能优化，头痛的性能问题也能随之解决。

posted on 2014-03-24 16:31 duanxz 阅读(1545) 评论(0) 收藏举报