图解Redis(一):数据结构,缓存使用,缓存问题,单线程,和Memcached区别

【参考自公众号:Java面试题精选】

之前也介绍过redis,但是今天看到了这位老哥写的文章,嗯.....不得不说,还是大佬厉害。写的很详细,有图有代码。在此对作者进行感谢,本文在原文基础上进行 了版本重新排版和润饰。

目录:

1、什么是redis

2、redis的五种基本数据类型

  • String
  • list
  • hashmap
  • set
  • zset

3、redis结合spring boot的使用(作为缓存使用)

4、缓存问题

  • 雪崩
  • 穿透
  • 击穿

5、Redis的速度

  • 单线程的好处

6、Redis和Memcached的区别

  • 存储方式上
  • 数据支持类型上
  • 使用底层模型不同
  • Value的大小

 


 

1、什么是Redis

Redis 是 C 语言开发的一个开源的(遵从 BSD 协议)高性能键值对(key-value)的内存数据库,可以用作数据库、缓存、消息中间件等。

它是一种 NoSQL(not-only sql,泛指非关系型数据库)的数据库。

其优点是,Redis 作为一个内存数据库:

  • 性能优秀,数据在内存中,读写速度非常快,支持并发 10W QPS。

  • 单进程单线程,是线程安全的,采用 IO 多路复用机制。

  • 丰富的数据类型,支持字符串(string)、散列(hash)、列表(list)、集合(set)、有序集合(sorted sets,又叫zset)等。

  • 支持数据持久化,可以将内存中数据保存在磁盘中,重启时加载。

  • 主从复制,哨兵,高可用。

  • 可以用作分布式锁。

  • 可以作为消息中间件使用,支持发布-订阅。

2、五种基本数据类型

在Redis 内部内存管理中是如何描述这五种基本类型:

 首先 Redis 内部使用一个 redisObject 对象来表示所有的 key 和 value。

 redisObject 最主要的信息如上图所示:type 表示一个 value 对象具体是何种数据类型,encoding 是不同数据类型在 Redis 内部的存储方式。比如:type=string 表示 value 存储的是一个普通字符串,那么 encoding 可以是 raw 或者 int。

那么,具体这五种类型是如何表示的呢?请往下看:

①:String

String是 Redis 最基本的类型,可以理解成与 Memcached一模一样的类型,一个 Key 对应一个 Value。Value 不仅是 String,也可以是数字。

String 类型是二进制安全的,意思是 Redis 的 String 类型可以包含任何数据,比如 jpg 图片或者序列化的对象。String 类型的值最大能存储 512M。

②:Hash

Hash是一个键值(key-value)的集合。Redis 的 Hash 是一个 String 的 Key 和 Value 的映射表,Hash 特别适合存储对象。常用命令:hget,hset,hgetall 等。

③:List

List列表是简单的字符串列表,按照插入顺序排序。可以添加一个元素到列表的头部(左边)或者尾部(右边) 常用命令:lpush、rpush、lpop、rpop、lrange(获取列表片段)等。

数据结构:List 就是链表,可以用来当消息队列用。Redis 提供了 List 的 Push 和 Pop 操作,还提供了操作某一段的 API,可以直接查询或者删除某一段的元素。

实现方式:Redis List 的是实现是一个双向链表,既可以支持反向查找和遍历,更方便操作,不过带来了额外的内存开销。

应用场景:List 应用场景非常多,也是 Redis 最重要的数据结构之一,比如 Twitter 的关注列表,粉丝列表都可以用 List 结构来实现。

④:Set

Set是 String 类型的无序集合。集合是通过 hashtable 实现的。Set 中的元素是没有顺序的,而且是没有重复的。常用命令:sdd、spop、smembers、sunion 等。

应用场景:Redis Set 对外提供的功能和 List 一样是一个列表,特殊之处在于 Set 是自动去重的,而且 Set 提供了判断某个成员是否在一个 Set 集合中。通过交集可查看是否有共同好友。

⑤:Zset

Zset和 Set 一样是 String 类型元素的集合,且不允许重复的元素。常用命令:zadd、zrange、zrem、zcard 等。当你需要一个有序的并且不重复的集合列表,那么可以选择 Sorted Set 结构。

 和 Set 相比,Sorted Set关联了一个 Double 类型权重的参数 Score,使得集合中的元素能够按照 Score 进行有序排列,Redis 正是通过分数score来为集合中的成员进行从小到大的排序。

实现方式:Redis Sorted Set 的内部使用 HashMap 和跳跃表(skipList)来保证数据的存储有序:HashMap 里放的是成员到 Score 的映射,而跳跃表里存放的是所有的成员,排序依据是 HashMap 里存的 Score,使用跳跃表的结构可以获得比较高的查找效率,并且在实现上比较简单。

五种数据类型总结:

 3、Redis结合spring boot的使用

结合 Spring Boot 使用,一般有两种方式:

  • 一种是直接通过 RedisTemplate 来使用;
  • 一种是使用 Spring Cache 集成 Redis(也就是注解的方式)。

接下来 我们做一个小case来看一下:

第一步:先引入对应的依赖:pom.xml 中添加:

<dependencies>
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-redis</artifactId>
    </dependency>
    <dependency>
        <groupId>org.apache.commons</groupId>
        <artifactId>commons-pool2</artifactId>
    </dependency>
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <dependency>
        <groupId>org.springframework.session</groupId>
        <artifactId>spring-session-data-redis</artifactId>
    </dependency>

    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-test</artifactId>
        <scope>test</scope>
    </dependency>
</dependencies>
View Code

注意:

1、spring-boot-starter-data-redis:在 Spring Boot 2.x 以后底层不再使用 Jedis,而是换成了 Lettuce。

2、commons-pool2:用作 Redis 连接池,如不引入启动会报错。

3、spring-session-data-redis:Spring Session 引入,用作共享 Session。

第二步:配置文件 application.yml 的配置:

server:
  port: 8082
  servlet:
    session:
      timeout: 30ms
spring:
  cache:
    type: redis
  redis:
    host: 127.0.0.1
    port: 6379
    password:
    # redis默认情况下有16个分片,这里配置具体使用的分片,默认为0
    database: 0
    lettuce:
      pool:
        # 连接池最大连接数(使用负数表示没有限制),默认8
        max-active: 100
View Code

第三步:创建实体类User.java

public class User implements Serializable{

    private static final long serialVersionUID = 662692455422902539L;

    private Integer id;

    private String name;

    private Integer age;

    public User() {
    }

    public User(Integer id, String name, Integer age) {
        this.id = id;
        this.name = name;
        this.age = age;
    }

    public Integer getId() {
        return id;
    }

    public void setId(Integer id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public Integer getAge() {
        return age;
    }

    public void setAge(Integer age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "User{" +
                "id=" + id +
                ", name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
}
View Code

第四步:分别通过两种方式来使用

(1)直接通过 RedisTemplate 来使用

默认情况下的模板只能支持 RedisTemplate<String, String>,也就是只能存入字符串,所以自定义模板很有必要。

添加配置类 RedisCacheConfig.java:

@Configuration
@AutoConfigureAfter(RedisAutoConfiguration.class)
public class RedisCacheConfig {

    @Bean
    public RedisTemplate<String, Serializable> redisCacheTemplate(LettuceConnectionFactory connectionFactory) {

        RedisTemplate<String, Serializable> template = new RedisTemplate<>();
        template.setKeySerializer(new StringRedisSerializer());
        template.setValueSerializer(new GenericJackson2JsonRedisSerializer());
        template.setConnectionFactory(connectionFactory);
        return template;
    }
}

添加测试类:

@RestController
@RequestMapping("/user")
public class UserController {

    public static Logger logger = LogManager.getLogger(UserController.class);

    @Autowired
    private StringRedisTemplate stringRedisTemplate;

    @Autowired
    private RedisTemplate<String, Serializable> redisCacheTemplate;

    @RequestMapping("/test")
    public void test() {
        redisCacheTemplate.opsForValue().set("userkey", new User(1, "张三", 25));
        User user = (User) redisCacheTemplate.opsForValue().get("userkey");
        logger.info("当前获取对象:{}", user.toString());
    }

然后在浏览器访问,观察后台日志 http://localhost:8082/user/test

 (2)使用 Spring Cache 集成 Redis(注解的方式)

Spring Cache 具备很好的灵活性,不仅能够使用 SPEL(spring expression language)来定义缓存的 Key 和各种 Condition,还提供了开箱即用的缓存临时存储方案,也支持和主流的专业缓存如 EhCache、Redis、Guava 的集成。

定义接口 UserService.java:

public interface UserService {

    User save(User user);

    void delete(int id);

    User get(Integer id);
}

接口实现类 UserServiceImpl.java:

@Service
public class UserServiceImpl implements UserService{

    public static Logger logger = LogManager.getLogger(UserServiceImpl.class);

    private static Map<Integer, User> userMap = new HashMap<>();
    static {
        userMap.put(1, new User(1, "肖战", 25));
        userMap.put(2, new User(2, "王一博", 26));
        userMap.put(3, new User(3, "杨紫", 24));
    }


    @CachePut(value ="user", key = "#user.id")
    @Override
    public User save(User user) {
        userMap.put(user.getId(), user);
        logger.info("进入save方法,当前存储对象:{}", user.toString());
        return user;
    }

    @CacheEvict(value="user", key = "#id")
    @Override
    public void delete(int id) {
        userMap.remove(id);
        logger.info("进入delete方法,删除成功");
    }

    @Cacheable(value = "user", key = "#id")
    @Override
    public User get(Integer id) {
        logger.info("进入get方法,当前获取对象:{}", userMap.get(id)==null?null:userMap.get(id).toString());
        return userMap.get(id);
    }
}
View Code

为了方便演示数据库的操作,这里直接定义了一个 Map<Integer,User> userMap。

注意,这里的核心是三个注解:

  • @Cachable

  • @CachePut

  • @CacheEvict

测试类:UserController

@RestController
@RequestMapping("/user")
public class UserController {

    public static Logger logger = LogManager.getLogger(UserController.class);

    @Autowired
    private StringRedisTemplate stringRedisTemplate;

    @Autowired
    private RedisTemplate<String, Serializable> redisCacheTemplate;

    @Autowired
    private UserService userService;

    @RequestMapping("/test")
    public void test() {
        redisCacheTemplate.opsForValue().set("userkey", new User(1, "张三", 25));
        User user = (User) redisCacheTemplate.opsForValue().get("userkey");
        logger.info("当前获取对象:{}", user.toString());
    }


    @RequestMapping("/add")
    public void add() {
        User user = userService.save(new User(4, "李现", 30));
        logger.info("添加的用户信息:{}",user.toString());
    }

    @RequestMapping("/delete")
    public void delete() {
        userService.delete(4);
    }

    @RequestMapping("/get/{id}")
    public void get(@PathVariable("id") String idStr) throws Exception{
        if (StringUtils.isBlank(idStr)) {
            throw new Exception("id为空");
        }
        Integer id = Integer.parseInt(idStr);
        User user = userService.get(id);
        logger.info("获取的用户信息:{}",user.toString());
    }
}
View Code

用缓存要注意,启动类要加上一个注解开启缓存

@SpringBootApplication(exclude=DataSourceAutoConfiguration.class)
@EnableCaching
public class Application {

    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }

}

①先调用添加接口:http://localhost:8082/user/add

 ②再调用查询接口,查询 id=4 的用户信息:

可以看出,这里已经从缓存中获取数据了,因为上一步 add 方法已经把 id=4 的用户数据放入了 Redis 缓存 3、调用删除方法,删除 id=4 的用户信息,同时清除缓存: 

 ④再次调用查询接口,查询 id=4 的用户信息:

 没有了缓存,所以进入了 get 方法,从 userMap 中获取。

缓存注解

①、@Cacheable

根据方法的请求参数对其结果进行缓存:

  • Key:缓存的 Key,可以为空,如果指定要按照 SPEL 表达式编写,如果不指定,则按照方法的所有参数进行组合。

  • Value:缓存的名称,必须指定至少一个(如 @Cacheable (value='user')或者 @Cacheable(value={'user1','user2'}))

  • Condition:缓存的条件,可以为空,使用 SPEL 编写,返回 true 或者 false,只有为 true 才进行缓存。

②、@CachePut

根据方法的请求参数对其结果进行缓存,和 @Cacheable 不同的是,它每次都会触发真实方法的调用。参数描述见上。

③、@CacheEvict

根据条件对缓存进行清空:

  • Key:同上。

  • Value:同上。

  • Condition:同上。

  • allEntries:是否清空所有缓存内容,缺省为 false,如果指定为 true,则方法调用后将立即清空所有缓存。

  • beforeInvocation:是否在方法执行前就清空,缺省为 false,如果指定为 true,则在方法还没有执行的时候就清空缓存。缺省情况下,如果方法执行抛出异常,则不会清空缓存。

4、缓存问题

在将redis作为缓存使用的过程中,会出现哪些问题呢?

比如,既然作为缓存,那肯定会存在和数据库的数据一致性问题。如果项目对缓存的要求比较高,是强一致性的,那么就不要使用缓存。而对于要求较低的场景,我们可以使用合适的策略来降低不一致的概率,如:合适的缓存更新策略,更新数据库后及时更新缓存,缓存失败后增加重试机制等。

  • 雪崩

那么,还有一种极端情况就是,当缓存中大部分或者所有的数据都是过期的了,那么在当某时间内有大量请求操作,那么此时这些请求就全部会落到数据库上,那么数据库如果扛不住的话,就发生了“雪崩”现象。

举个栗子:

目前电商首页以及热点数据都会去做缓存,一般缓存都是定时任务去刷新,或者查不到之后去更新缓存的,定时任务刷新就有一个问题。

如果首页所有 Key 的失效时间都是 12 小时,中午 12 点刷新的,我零点有个大促活动大量用户涌入,假设每秒 6000 个请求,本来缓存可以抗住每秒 5000 个请求,但是缓存中所有 Key 都失效了。此时 6000 个/秒的请求全部落在了数据库上,数据库必然扛不住,直接挂掉。如果重启DB,数据库立马又会被新流量给打死了。

这就是我理解的缓存雪崩——同一时间大面积失效,瞬间 Redis 跟没有一样,那这个数量级别的请求直接打到数据库几乎是灾难性的。

你想想如果挂的是一个用户服务的库,那其他依赖他的库所有接口几乎都会报错。如果没做熔断等策略基本上就是瞬间挂一片的节奏,你怎么重启用户都会把你打挂,等你重启好的时候,用户早睡觉去了,临睡之前,骂骂咧咧“什么垃圾产品”。

那么,这种情况如何解决呢?(如何解决雪崩问题)

在批量往Redis里存数据时,给每个Key都加一个随机失效时间,这样就不会产生大片数据同时失效的情况, 从根源上解决。

setRedis(key, value, time+Math.random()*10000);

如果Redis是集群部署,那么将热点数据均匀分散到不同的Redis库中,这样也可以避免全部失效。

再不济就是设置热点数据永不过期,有更新操作就更新缓存,如运维更新了首页商品,那你刷下缓存就OK,。

  • 缓存穿透

 缓存穿透指的是缓存和数据库中都没有,但是用户却在不断地发起请求。

举个栗子:我们数据库的 id 都是从 1 自增的,如果发起 id=-1 的数据或者 id 特别大不存在的数据,这样的不断攻击导致数据库压力很大,严重会击垮数据库。

解决办法:

在接口层增加校验,比如:用户鉴权,参数做校验,不合法的校验直接return,比如id做基础校验,id<=0直接拦截等。

此外,还有一个高端玩家的玩法,就是使用布隆过滤器(Bloom Filter),其原理就是利用高效的数据结构和算法快速判断你这个Key是否在DB中存在,如果不存在就返回,存在就去查DB刷新K-V再返回。

  • 缓存击穿

 缓存击穿和缓存雪崩类似,但是又不完全一样。雪崩是因为大面积的缓存失效,导致大量请求打崩了DB。而击穿是指一个key非常热点,在不停的扛着大量的请求,大并发集中对这一个点进行访问,当这个Key在失效的瞬间,持续的大并发直接落到了DB上,就在这个Key的点上击穿了缓存。

即:雪崩可以理解为是大面积的击穿。

 那么,击穿该如何解决呢?

有两条思路:

一是像解决雪崩类似,只不过雪崩是设置过期时间为随机的,而击穿是设置热点数据永不过期;

二是加上互斥锁。即先在redis缓存中查找,如果缓存中没有,则获得锁,再去DB中查找,查到后返回并更新Redis缓存,再释放锁。有人问,这里去DB中如果也查不到呢?那怎么办,大哥,去DB中查不到,那就不是击穿了,那是穿透了,哈哈哈。

加互斥锁代码如下:

public static String getData(String key) throws InterruptedException {
        //从Redis查询数据
        String result = getDataByKV(key);
        //参数校验
        if (StringUtils.isBlank(result)) {
            try {
                //获得锁
                if (reenLock.tryLock()) {
                    //去数据库查询
                    result = getDataByDB(key);
                    //校验
                    if (StringUtils.isNotBlank(result)) {
                        //插进缓存
                        setDataToKV(key, result);
                    }
                } else {
                    //睡一会再拿
                    Thread.sleep(100L);
                    result = getData(key);
                }
            } finally {
                //释放锁
                reenLock.unlock();
            }
        }
        return result;
    }

 

5、Redis的速度

对于Redis速度,不用我说了,肯定很快啦,要不然大家也不会用它。

官方提供的数据显示:它可以达到 100,000+ 的 QPS(每秒内的查询次数),这个数据不比 Memcached 差!

我们知道Redis是单线程的,那么为什么还能这么快呢?

Redis 确实是单进程单线程的模型,因为 Redis 完全是基于内存的操作,CPU 不是 Redis 的瓶颈,Redis 的瓶颈最有可能是机器内存的大小或者网络带宽。既然单线程容易实现,而且 CPU 不会成为瓶颈,那就顺理成章的采用单线程的方案了(毕竟采用多线程会有很多麻烦)。

之所以单线程还快,有如下四点:

  • Redis 完全基于内存,绝大部分请求是纯粹的内存操作,非常迅速,数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操作的时间复杂度是 O(1)。

  • 数据结构简单,对数据操作也简单。

  • 采用单线程,避免了不必要的上下文切换和竞争条件,不存在多线程导致的 CPU 切换,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有死锁问题导致的性能消耗。

  • 使用多路复用 IO 模型,非阻塞 IO。

 

6、Redis和Memcached的区别

平时为什么选择 Redis 的缓存方案而不用 Memcached ?

原因有如下四点:

  • 存储方式上:Memcache 会把数据全部存在内存之中,断电后会挂掉,数据不能超过内存大小。Redis 有部分数据存在硬盘上,这样能保证数据的持久性。

  • 数据支持类型上:Memcache 对数据类型的支持简单,只支持简单的 key-value,,而 Redis 支持五种数据类型。

  • 使用底层模型不同:它们之间底层实现方式以及与客户端之间通信的应用协议不一样。Redis 直接自己构建了 VM 机制,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求。

  • Value 的大小:Redis 可以达到 1GB,而 Memcache 只有 1MB。

 

 

 

 

参考及致谢:

1、【244期】万字+图解 Redis,面试不用愁了!

posted @ 2021-04-17 23:50  额是无名小卒儿  阅读(276)  评论(0编辑  收藏  举报