缓存设计与优化

缓存的受益与成本

1.受益

加速读写
- CPU L1/L2/L3 Cache、浏览器缓存、Ehcache缓存数据库结果
降低后端负载
- 后端服务器通过前端缓存降低负载：业务端使用Redis降低后端MySQL的负载

2.成本

数据不一致：缓存层和数据层有时间窗口不一致问题，和更新策略有关
代码维护成本：多了一层缓存逻辑
运维成本：例如Redis Cluster

3.使用场景

降低后端负载
- 对高消耗的SQL：join结果集/分组统计结果缓存
加速请求响应
- 利用Redis/Memcache优化IO响应时间
大量写合并为批量写
- 入计数器先Redis累加再批量写DB

缓存的更新策略

###1.LRU等算法剔除：例如 maxmemory-policy

淘汰策略	含义
noeviction	当内存使用达到阈值的时候，所有引起申请内存的命令会报错
allkeys-lru	在主键空间中，优先移除最近未使用的key
volatile-lru	在设置了过期时间的键空间中，优先移除最近未使用的key
allkeys-random	最主键空间中，随机移除某个key
volatile-random	在设置了过期的键空间中，随机移除某个key
volatile-ttl	在设置了过期时间的键空间中，具有更早过期时间的key优先移除

2.超时剔除：例如expire

###3.主动更新：开发控制生命周期

4.两条建议

低一致性数据：最大内存和淘汰策略
高一致性：超时剔除和主动更新结合，最大内存和淘汰策略兜底

缓存粒度问题

通用性：全量属性更好
占用空间：部分属性更好
代码维护：表面上全量属性更好

缓存穿透优化

含义：查询一个不存在的数据，由于缓存是不命中时需要从数据库查询，查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到数据库去查询
产生原因
- 业务代码自身问题
- 恶意攻击、爬虫
发现问题
- 业务的响应时间，受到恶意攻击时，普遍请求被打到存储层，必会引起响应时间提高，可通过监控发现。
- 业务本身问题
- 相关指标：总调用数、缓存层命中数、存储层命中数

###解决方法1：缓存空对象（设置过期时间）

含义：当存储层查询不到数据后，往cache层中存储一个null，后期再被查询时，可以通过cache返回null。
缺点
- cache层需要存储更多的key
- 缓存层和数据层数据“短期”不一致
示例代码

public String getPassThrough(String key) {
    String cacheValue = cache.get(key);
    if( StringUtils.isEmpty(cacheValue) ) {
        String storageValue = storage.get(key);
        cache.set(key , storageValue);
        if( StringUtils.isEmpty(storageValue) ) {
            cache.expire(key , 60 * 5 );
        } 
        return storageValue;
    } else {
        return cacheValue;
    }
}

###解决方法2：布隆过滤器拦截（适合固定的数据）

将所有可能存在的数据哈希到一个足够大的bitmap中，一个不存在的数据会被这个bitmap拦截掉，从而避免了对底层存储系统的查询压力

缓存雪崩优化

含义：由于cache服务器承载大量的请求，当cache服务异常脱机，流量直接压向后端组件，造成级联故障。或者缓存集中在一段时间内失效，发生大量的缓存穿透

解决方法1：保证缓存高可用性

做到缓存多节点、多机器、甚至多机房。
Redis Cluster、Redis Sentinel
做二级缓存

解决方法2：依赖隔离组件为后端限流

使用Hystrix做服务降级

解决方法3：提前演练（压力测试）

解决方法4：对不同的key随机设置过期时间

无底洞问题

问题描述：添加机器时，客户端的性能不但没提升，反而下降
问题关键点
- 更多的机器 != 更高的性能
- 更多的机器 = 数据增长与水平扩展
- 批量接口需求：一次mget随着机器增多，网络节点访问次数更多。网络节点的时间复杂度由O(1) -> O(node)
优化IO的方法
- 命令本身优化：减少慢查询命令：keys、hgetall、查询bigKey并进行优化
- 减少网络通信次数
  - mget由O(keys)，升级为O(node)，O(max_slow(node)) , 甚至是O(1)
- 降低接入成本：例如客户端长连接/连接池、NIO等

热点Key的重建优化

热点Key（访问量比较大） + 较长的重建时间（重建过程中的API或者接口比较费时间）
导致的问题：有大量的线程会去查询数据源并重建缓存，对存储层造成了巨大的压力，响应时间会变得很慢

1.三个目标

减少重建缓存的次数
数据尽可能一致
减少潜在危险：例如死锁、线程池大量被hang住（悬挂）

2.两种解决方案

互斥锁（分布式锁）

第一个线程需要重建时候，对这个Key的重建加入分布式锁，重建完成后进行解锁
这个方法避免了大量的缓存重建与存储层的压力，但是还是会有大量线程的阻塞

jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime)

String get(String key) {
    String SET_IF_NOT_EXIST = "NX";
    String SET_WITH_EXPIRE_TIME = "PX";
    
    String value = jedis.get(key);
    if( null == value ) {
        String lockKey = "lockKey:" + key;
        if( "OK".equals(jedis.set(lockKey , "1" , SET_IF_NOT_EXIST , 
                      SET_WITH_EXPIRE_TIME , 180)) ) {
            value = db.get(key);
            jedis.set(key , value);
            jedis.delete(lockKey);
        } else {
            Thread.sleep(50);
            get(key);
        }
    }
    return value;
}

永远不过期
- 缓存层面：不设置过期时间（不使用expire）
- 功能层面：为每个value添加逻辑过期时间，单发现超过逻辑过期时间后，会使用单独的线程去重建缓存。
- 还存在一个数据不一致的情况。可以将逻辑过期时间相对实际过期时间相对减小

缓存的受益与成本

1.受益

加速读写
- CPU L1/L2/L3 Cache、浏览器缓存、Ehcache缓存数据库结果
降低后端负载
- 后端服务器通过前端缓存降低负载：业务端使用Redis降低后端MySQL的负载

2.成本

数据不一致：缓存层和数据层有时间窗口不一致问题，和更新策略有关
代码维护成本：多了一层缓存逻辑
运维成本：例如Redis Cluster

3.使用场景

降低后端负载
- 对高消耗的SQL：join结果集/分组统计结果缓存
加速请求响应
- 利用Redis/Memcache优化IO响应时间
大量写合并为批量写
- 入计数器先Redis累加再批量写DB

缓存的更新策略

###1.LRU等算法剔除：例如 maxmemory-policy

淘汰策略	含义
noeviction	当内存使用达到阈值的时候，所有引起申请内存的命令会报错
allkeys-lru	在主键空间中，优先移除最近未使用的key
volatile-lru	在设置了过期时间的键空间中，优先移除最近未使用的key
allkeys-random	最主键空间中，随机移除某个key
volatile-random	在设置了过期的键空间中，随机移除某个key
volatile-ttl	在设置了过期时间的键空间中，具有更早过期时间的key优先移除

2.超时剔除：例如expire

###3.主动更新：开发控制生命周期

4.两条建议

低一致性数据：最大内存和淘汰策略
高一致性：超时剔除和主动更新结合，最大内存和淘汰策略兜底

缓存粒度问题

通用性：全量属性更好
占用空间：部分属性更好
代码维护：表面上全量属性更好

缓存穿透优化

含义：查询一个不存在的数据，由于缓存是不命中时需要从数据库查询，查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到数据库去查询
产生原因
- 业务代码自身问题
- 恶意攻击、爬虫
发现问题
- 业务的响应时间，受到恶意攻击时，普遍请求被打到存储层，必会引起响应时间提高，可通过监控发现。
- 业务本身问题
- 相关指标：总调用数、缓存层命中数、存储层命中数

###解决方法1：缓存空对象（设置过期时间）

含义：当存储层查询不到数据后，往cache层中存储一个null，后期再被查询时，可以通过cache返回null。
缺点
- cache层需要存储更多的key
- 缓存层和数据层数据“短期”不一致
示例代码

public String getPassThrough(String key) {
    String cacheValue = cache.get(key);
    if( StringUtils.isEmpty(cacheValue) ) {
        String storageValue = storage.get(key);
        cache.set(key , storageValue);
        if( StringUtils.isEmpty(storageValue) ) {
            cache.expire(key , 60 * 5 );
        } 
        return storageValue;
    } else {
        return cacheValue;
    }
}

###解决方法2：布隆过滤器拦截（适合固定的数据）

将所有可能存在的数据哈希到一个足够大的bitmap中，一个不存在的数据会被这个bitmap拦截掉，从而避免了对底层存储系统的查询压力

缓存雪崩优化

含义：由于cache服务器承载大量的请求，当cache服务异常脱机，流量直接压向后端组件，造成级联故障。或者缓存集中在一段时间内失效，发生大量的缓存穿透

解决方法1：保证缓存高可用性

做到缓存多节点、多机器、甚至多机房。
Redis Cluster、Redis Sentinel
做二级缓存

解决方法2：依赖隔离组件为后端限流

使用Hystrix做服务降级

解决方法3：提前演练（压力测试）

解决方法4：对不同的key随机设置过期时间

无底洞问题

问题描述：添加机器时，客户端的性能不但没提升，反而下降
问题关键点
- 更多的机器 != 更高的性能
- 更多的机器 = 数据增长与水平扩展
- 批量接口需求：一次mget随着机器增多，网络节点访问次数更多。网络节点的时间复杂度由O(1) -> O(node)
优化IO的方法
- 命令本身优化：减少慢查询命令：keys、hgetall、查询bigKey并进行优化
- 减少网络通信次数
  - mget由O(keys)，升级为O(node)，O(max_slow(node)) , 甚至是O(1)
- 降低接入成本：例如客户端长连接/连接池、NIO等

热点Key的重建优化

热点Key（访问量比较大） + 较长的重建时间（重建过程中的API或者接口比较费时间）
导致的问题：有大量的线程会去查询数据源并重建缓存，对存储层造成了巨大的压力，响应时间会变得很慢

1.三个目标

减少重建缓存的次数
数据尽可能一致
减少潜在危险：例如死锁、线程池大量被hang住（悬挂）

2.两种解决方案

互斥锁（分布式锁）

第一个线程需要重建时候，对这个Key的重建加入分布式锁，重建完成后进行解锁
这个方法避免了大量的缓存重建与存储层的压力，但是还是会有大量线程的阻塞

jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime)

String get(String key) {
    String SET_IF_NOT_EXIST = "NX";
    String SET_WITH_EXPIRE_TIME = "PX";
    
    String value = jedis.get(key);
    if( null == value ) {
        String lockKey = "lockKey:" + key;
        if( "OK".equals(jedis.set(lockKey , "1" , SET_IF_NOT_EXIST , 
                      SET_WITH_EXPIRE_TIME , 180)) ) {
            value = db.get(key);
            jedis.set(key , value);
            jedis.delete(lockKey);
        } else {
            Thread.sleep(50);
            get(key);
        }
    }
    return value;
}

永远不过期
- 缓存层面：不设置过期时间（不使用expire）
- 功能层面：为每个value添加逻辑过期时间，单发现超过逻辑过期时间后，会使用单独的线程去重建缓存。
- 还存在一个数据不一致的情况。可以将逻辑过期时间相对实际过期时间相对减小

posted @ 2019-05-23 16:15 老衲吃个饭阅读(1518) 评论(0) 编辑收藏举报

刷新页面返回顶部

老衲吃个饭

每天进步一丢丢.

缓存设计与优化

缓存的受益与成本

1.受益

2.成本

3.使用场景

缓存的更新策略

2.超时剔除：例如expire

4.两条建议

缓存粒度问题

缓存穿透优化

缓存雪崩优化

解决方法1：保证缓存高可用性

解决方法2：依赖隔离组件为后端限流

解决方法3：提前演练（压力测试）

解决方法4：对不同的key随机设置过期时间

无底洞问题

热点Key的重建优化

1.三个目标

2.两种解决方案

缓存的受益与成本

1.受益

2.成本

3.使用场景

缓存的更新策略

2.超时剔除：例如expire

4.两条建议

缓存粒度问题

缓存穿透优化

缓存雪崩优化

解决方法1：保证缓存高可用性

解决方法2：依赖隔离组件为后端限流

解决方法3：提前演练（压力测试）

解决方法4：对不同的key随机设置过期时间

无底洞问题

热点Key的重建优化

1.三个目标

2.两种解决方案

公告