NOSQL中的redis缓存数据库
NOSQL概述
什么是NOSQL?
NoSql(NoSQL=Not Only SQL),意思为"不仅仅是SQL",是一个全新的数据库理念,泛指非关系型的数据库.
为什么需要NOSQL?
随着互联网的高速崛起,网站的用户群的增加,访问量的上升,传统数据库上都开始出现了性能瓶颈,web程序再仅仅专注在功能上,同时也在追求性能。所以NOSQL数据库应运而上,具体表现为对如下三高问题的解决:
High performance - 对数据库高并发读写的需求
web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求,例如网站的实时统计在线用户状态,记录热门帖子的点击次数,投票计数等,因此这是一个相当普遍的需求。
Huge Storage - 对海量数据的高效率存储和访问的需求
类似Facebook,twitter,Friendfeed这样的SNS网站,每天用户产生海量的用户动态,以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。
High Scalability && High Availability- 对数据库的高可扩展性和高可用性的需求
在基于web的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像web server和app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,为什么数据库不能通过不断的添加服务器节点来实现扩展呢?
主流的NOSQL产品
键值(key-value)存储数据库
相关产品:Tokyo Cabinet/Tyrant Redis Voldemort Berkeley DB
典型应用:内容缓存,主要用于处理大量数据的高访问负载
数据模型:一系列键值对
优势:快速查询
劣势:存储的数据缺少结构化
列存储数据库
相关产品:Cassandra. HBase Riak
典型应用:分布式的文件系统
数据模型:以列簇式存储,将同一列数据存在一起.
优势:查询速度快,可拓展性强,更容易进行分布式拓展
劣势:功能相对局限
文档型数据库
相关产品:CouchDB MongoDB
典型应用:WEB应用(与Key-Value类似.Value是结构化的)
数据模型:一系列键值对
优势:数据结构要求不严格
劣势:查询性能不高,而且缺乏同意的查询语法
图形数据库
相关数据库:Neo4J InfoGrid Infinite Graph
典型应用:社交网络
数据模型:图结构
优势:利用结构相关算法
劣势:需要对整个图做计算才能得到结果,不容易做分布式的集群方案.
NOSQL的特点
在大数据存取上具备关系型数据库无法比拟的性能优势,例如:
易拓展
NOSQL数据库种类繁多,但是有一个共同的特点都是去掉关系数据库的关系型特性,数据之间无关系,这样就非常容易拓展,也无形之间,在架构的层面上带来了可拓展的能力
大数据量,高性能
NOSQL数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀.这得益于它的无关系性,数据库的结构简单
灵活的数据模型
NOSQL无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式,而在关系数据库里,增删字段是一件非常麻烦的事情.如果是非常大数据量的表,增加字段简直就是一个噩梦,这点在大数量的Web2.0时代尤其明显.
高可用
NOSQL在不太影响性能的情况下,就可以方便的实现高可用的架构,比如Cassandra,HBase模型,通过复制模型也能实现高可用.
Rrdis概述
什么是Redis? Rredis共有16个数据库
Redis是用C语言开发的一个开源的高性能键值对(key-value)数据库,官方提供的测试数据,50个并发执行100000个请求,读的速度是110000次每秒,写的速度是81000次每秒,且Redis通过提供多种键值数据类型来适应不同场景下的存储需求,目前为止Redis支持的内置键值数据类型如下:
字符串类型String
散列类型 hash
列表类型list
集合类型 set
有序的集合类型sortedset
redis的应用场景
缓存(数据查询,短连接,新闻内容,商品内容等等)
聊天室的在线好友列表
任务队列(秒杀,抢购,12306等等)
应用排行榜
网站访问统计
数据过期处理(可以精确到毫秒)
分布式集群架构中的session分离
Redis的数据类型
redis是一种高级的key-value的存储系统.其中value支持五中数据类型:
字符串(string)
散列(hash)
列表(list)
集合(set)
有序集合(sortedset)
关于key的定义,注意如下几点:
key不要太长,最好不要操作1024个字节,这不仅会消耗内存还会降低查找的效率
key不要太短,如果太短会降低key的可读性
在项目中,key最好有一个同意的命名规范.
字符串类型string
字符串类型string概述
字符串类型是Redis中最为基础的数据存储类型,它在Redis中是二进制安全的,这便意味着该类型存入和获取的数据类型相同.在Redis中字符串类型的Value最多可以容纳的数据长度是512M
字符串类型string常用命令
set key value
设定key特有指定的字符串value,如果该可以存在则进行覆盖操作.总是返回"OK"
127.0.0.1:6379>set qingmu "aini"
ok
127.0.0.1:6379>
get key
获取key的value,如果与该key关联的value不是String类型,redis将返回错误信息,因为get命令只能用于获取String value;如果key不存在,返回(nil)
127.0.0.1:6379>set qingmu "aini" OK 127.0.1:6379>get qingmu "aini"
del key
删除指定key
127.0.0.1:6379>del name (integer) 1 127.0.0.1:6379>get name (nil) incr命令 自增 decr命令 自减 incrby key step 自增步数 descby key step 自减步数
哈希类型hash
哈希类型hash概述
Redis中的Hash类型可以看成具有String key和String Value的map容器.所以该类型非常适合于存储值独享的信息.如Username,Password和Age等.如果Hash中包含很少的字段,那么该类型的数据也将仅占用很少的磁盘空间,每一个Hash可以存储4294967295个键值对
哈希类型hash常用的命令
hset key field value
为指定的key设定fiele/value(键值对)
127.0.01:6379>hset myhash username haohao
(integer) 1
127.0.0.1:6379>
hget key field
返回指定的key中的field的值
127.0.0.1:6379>hset myhash username haohao (integer) 1 127.0.0.1:6379>hget myhash username "haohao"
hdel key field[field...]
可以删除一个或者多个字段,返回值是被删除的字段个数
127.0.0.1:6379>hdel muhash username (integer) 1 127.0.0.1:6379>hget myhash username (nil) 127.0.0.1:6379>
hgetall key
可以获取该键的所有数据
127.0.0.1:6379>hgetall myhash
1)"username"
2)"tom"
3)"password"
4)"123"
127.0.0.1:6379>
列表类型list
列表类型list概述
在Redis中,List类型是按照插入顺序排序的字符串链表,和数据结构中的普通链表一样,我们可以在其头部(left)和尾部(right)添加新的元素.在插入时,在插入时,如果该键并不存在,Redis将为该键创建一个新的链表,与此相反,如果链表中所有的元素均被移除,那么该键也会被从数据库中删除,List中可以包含的最大元素数量是4294967295
列表类型list
lpush key values [value1 value2...]
在指定的key所关联的list的头部插入所有的values,如果该key不存在,该命令在插入的之前创建一个与该key关联的空链表,之后再向该链表的头部插入数据插入成功,返回元素的个数.
127.0.0.1:6379> lpush mylist a b c
(integer) 3
127.0.0.1:6379>
lpop key
返回并弹出指定的key关联的链表中的第一个元素,即头部元素.如果该key不存在,返回null;若key存在,则返回链表的头部元素.
127.0.0.1:6379> lpush mylist a b c (integer) 3 127.0.0.1:6379> lpop mylist "c" 127.0.0.1:6379> lpop mylist "b"
rpop key
从尾部弹出元素
127.0.0.1:6379> lpush mylist a b c (integer) 3 127.0.0.1:6379> rpop mylist "a"
lrange key 索引索引
127.0.0.1:6379> LRANGE mylist 0 -1 1) "d" 2) "c" 3) "b" 4) "a" 5) "1" 6) "2" 7) "3" 8) "4" 0 -1 遍历全部
集合类型set
在Redis中,我们可以将Set类型看作为没有排序的字符集合,和List类型一样,我们也可以在该类型的数据值上执行添加、删除或判断某一元素是否存在等操作。需要说明的是,这些操作的时间复杂度为O(1),即常量时间内完成次操作。Set可包含的最大元素数量是4294967295,和List类型不同的是,Set集合中不允许出现重复的元素。
集合类型set的常用命令
sadd key values[value1、value2…]
向set中添加数据,如果该key的值已有则不会重复添加
127.0.0.1:6379> sadd myset a b c
(integer) 3
smembers key
获取set中所有的成员
127.0.0.1:6379> sadd myset a b c (integer) 3 127.0.0.1:6379> smembers myset 1) "c" 2) "a" 3) "b"
srem key members [member1、member2…]
删除set中指定的成员
127.0.0.1:6379> srem myset a b (integer) 2 127.0.0.1:6379> smembers myset 1) "c" 127.0.0.1:6379>
有序集合类型sortset
在redis中,可以保证不重复的元素,仍然可以进行排序
有序集合类型sortset常用命令
zadd key values[value1、value2…]
向set中添加成员
127.0.0.1:6379> zadd 5 lisi 10 xiaoming 7 xiaohua 8 xiaogou
zrem key value
移除set中的成员
ZREM myset lisi
zrange key 索引 索引
通过索引区间返回有序集合成指定区间内的成员
127.0.0.1:6379> zrange myset 0 -1 1) "lisi" 2) "xiaohua" 3) "xiaogou" 4) "xiaoming"
Redis的通用命令
keys pattern
获取所有与pattern匹配的key,返回所有与该key匹配的keys。*表示任意一个或多个字符,?表示任意一个字符
127.0.0.1:6379> keys * 1) "company" 2) "mylist" 3) "myhash" 4) "myset"
del key1 key2…
删除指定的key
127.0.0.1:6379> del company
(integer) 1
exists key
判断该key是否存在,1代表存在,0代表不存在
127.0.0.1:6379> exists compnay (integer) 0 127.0.0.1:6379> exists mylist (integer) 1 127.0.0.1:6379>
type key
获取指定key的类型。该命令将以字符串的格式返回。 返回的字符串为string、list、set、hash,如果key不存在返回none
127.0.0.1:6379> type company string 127.0.0.1:6379> type mylist list 127.0.0.1:6379> type myset set 127.0.0.1:6379> type myhash hash 127.0.0.1:6379>
Redis的持久化
Redis的高性能是由于其将所有数据都存储在了内存中,为了使Redis在重启之后仍能保证数据不丢失,需要将数据从内存中同步到硬盘中,这一过程就是持久化。Redis支持两种方式的持久化,一种是RDB方式,一种是AOF方式。可以单独使用其中一种或将二者结合使用。
RDB持久化(默认支持,无需配置)
该机制是指在指定的时间间隔内将内存中的数据集快照写入磁盘。
AOF持久化
该机制将以日志的形式记录服务器所处理的每一个写操作,在Redis服务器启动之初会读取该文件来重新构建数据库,以保证启动后数据库中的数据是完整的。
无持久化
我们可以通过配置的方式禁用Redis服务器的持久化功能,这样我们就可以将Redis视为一个功能加强版的
memcached(这个也是一个缓存数据库,只是不能进行持久化)了。
redis可以同时使用RDB和AOF
RDB持久化机制
RDB持久化机制优点
一旦采用该方式,那么你的整个Redis数据库将只包含一个文件,这对于文件备份而言是非常完美的。比如,你可能打算每个小时归档一次最近24小时的数据,同时还要每天归档一次最近30天的数据。通过这样的备份策略,一旦系统出现灾难性故障,我们可以非常容易的进行恢复。对于灾难恢复而言,RDB是非常不错的选择。因为我们可以非常轻松的将一个单独的文件压缩后再转移到其它存储介质上性能最大化。对于Redis的服务进程而言,在开始持久化时,它唯一需要做的只是fork(分叉)出子进程,之后再由子进程完成这些持久化的工作,这样就可以极大的避免服务进程执行IO操作了。
相比于AOF机制,如果数据集很大,RDB的启动效率会更高
RDB持久化机制缺点
如果你想保证数据的高可用性,即最大限度的避免数据丢失,那么RDB将不是一个很好的选择。因为系统一
旦在定时持久化之前出现宕机现象,此前没有来得及写入磁盘的数据都将丢失。由于RDB是通过fork子进程来协助完成数据持久化工作的,因此,如果当数据集较大时,可能会导致整个服务器停止服务几百毫秒,甚至是1秒钟
RDB持久化机制的配置
在redis.windows.conf配置文件中有如下配置:
################################ SNAPSHOTTING ################################# # # Save the DB on disk: # # save <seconds> <changes> # # Will save the DB if both the given number of seconds and the given # number of write operations against the DB occurred. # # In the example below the behaviour will be to save: # after 900 sec (15 min) if at least 1 key changed # after 300 sec (5 min) if at least 10 keys changed # after 60 sec if at least 10000 keys changed # # Note: you can disable saving at all commenting all the "save" lines. # # It is also possible to remove all the previously configured save # points by adding a save directive with a single empty string argument # like in the following example: # # save "" save 900 1 save 300 10 save 60 10000
其中,上面配置的是RDB方式数据持久化时机:
关键字 时间(秒) key修改数量 解释
save 900 1 每900秒(15分钟) 至少有1个key发生变化,则dump内存快照
save 300 10 每300秒(5分钟) 至少有10个key发生变化,则dump内存快照
save 60 10000 每60秒(1分钟) 至少有10000个key发生变化,则dump内存快照
AOF持久化机制优点
该机制可以带来更高的数据安全性,即数据持久性。Redis中提供了3中同步策略,即每秒同步、每修改同步
和不同步。事实上,每秒同步也是异步完成的,其效率也是非常高的,所差的是一旦系统出现宕机现象,那
么这一秒钟之内修改的数据将会丢失。而每修改同步,我们可以将其视为同步持久化,即每次发生的数据变
化都会被立即记录到磁盘中。可以预见,这种方式在效率上是最低的。至于无同步,无需多言,我想大家都
能正确的理解它。
由于该机制对日志文件的写入操作采用的是append模式,因此在写入过程中即使出现宕机现象,也不会破坏
日志文件中已经存在的内容。然而如果我们本次操作只是写入了一半数据就出现了系统崩溃问题,不用担
心,在Redis下一次启动之前,我们可以通过redis-check-aof工具来帮助我们解决数据一致性的问题。
如果日志过大,Redis可以自动启用rewrite机制。即Redis以append模式不断的将修改数据写入到老的磁盘文
件中,同时Redis还会创建一个新的文件用于记录此期间有哪些修改命令被执行。因此在进行rewrite切换时可以更好的保证数据安全性。
AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。事实上,我们也可以通过该文件完成数据的重建.
AOF持久化机制缺点
对于相同数量的数据集而言,AOF文件通常要大于RDB文件
根据同步策略的不同,AOF在运行效率上往往会慢于RDB。总之,每秒同步策略的效率是比较高的,同步禁用策略的效率和RDB一样高效。
AOF持久化机制配置
开启AOF持久化
############################## APPEND ONLY MODE ############################### # By default Redis asynchronously dumps the dataset on disk. This mode is # good enough in many applications, but an issue with the Redis process or # a power outage may result into a few minutes of writes lost (depending on # the configured save points). # # The Append Only File is an alternative persistence mode that provides # much better durability. For instance using the default data fsync policy # (see later in the config file) Redis can lose just one second of writes in a # dramatic event like a server power outage, or a single write if something # wrong with the Redis process itself happens, but the operating system is # still running correctly. # # AOF and RDB persistence can be enabled at the same time without problems. # If the AOF is enabled on startup Redis will load the AOF, that is the file # with the better durability guarantees. # # Please check http://redis.io/topics/persistence for more information. appendonly no
将appendonly修改为yes,开启aof持久化机制,默认会在目录下产生一个appendonly.aof文件
AOF持久化时机
# appendfsync always
appendfsync everysec
# appendfsync no
上述配置为aof持久化的时机,解释如下:
关键字 持久化时机 解释
appendfsync always 每执行一次更新命令,持久化一次
appendfsync everysec 每秒钟持久化一次
appendfsync no 不持久化
上面简单的介绍了一下Redis数据库
然后介绍一下Jedis
Redis不仅是使用命令来操作,现在基本上主流的语言都有客户端支持,比如java、C、C#、C++、php、Node.js、Go等。 在官方网站里列一些Java的客户端,有Jedis、Redisson、Jredis、JDBC-Redis、等其中官方推荐使用Jedis和Redisson。 在企业中用的最多的就是Jedis,Jedis同样也是托管在github上,地址:https://github.com/xetorthio/jedis。
如果没有使用maven管理依赖,则使用Jedis操作redis需要导入jar包如下:
Jedis官方文档在:
http://xetorthio.github.io/jedis/
查询API文档的查询方式:
常用的API是:
Jedis的一个简单测试:
@Test public void testJedisSingle(){ //1 设置ip地址和端口 Jedis jedis = new Jedis("localhost", 6379); //2 设置数据 jedis.set("name", "itheima"); //3 获得数据 String name = jedis.get("name"); System.out.println(name); //4 释放资源 jedis.close(); }
Jedis连接池的使用:
jedis连接池的基本概念
jedis连接资源的创建与销毁是很消耗程序性能,所以jedis为我们提供了jedis的池化技术,jedisPool在创建时初始化一些连接资源存储到连接池中,使用jedis连接资源时不需要创建,而是从连接池中获取一个资源进行redis的操作,使用完毕后,不需要销毁该jedis连接资源,而是将该资源归还给连接池,供其他请求使用。
JedisPool的基本使用
@Test public void testJedisPool(){ //1 获得连接池配置对象,设置配置项 JedisPoolConfig config = new JedisPoolConfig(); // 1.1 最大连接数 config.setMaxTotal(30); // 1.2 最大空闲连接数 config.setMaxIdle(10); //2 获得连接池 JedisPool jedisPool = new JedisPool(config, "localhost", 6379); //3 获得核心对象 Jedis jedis = null; try { jedis = jedisPool.getResource(); //4 设置数据 jedis.set("name", "itcast"); //5 获得数据 String name = jedis.get("name"); System.out.println(name); } catch (Exception e) { e.printStackTrace(); } finally{ if(jedis != null){ jedis.close(); } // 虚拟机关闭时,释放pool资源 if(jedisPool != null){ jedisPool.close(); } } }
编写的一个jedis连接池的工具类
jedisUtils.java
package com.itheima.utils; import java.util.ResourceBundle; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoolConfig; public class JedisUtils { private static JedisPoolConfig poolConfig = null; private static JedisPool jedisPool = null; private static Integer maxTotal = null; private static Integer maxIdle = null; private static String host = null; private static Integer port = null; static{ //读取配置文件 获得参数值 ResourceBundle rb = ResourceBundle.getBundle("jedis"); maxTotal = Integer.parseInt(rb.getString("jedis.maxTotal")); maxIdle = Integer.parseInt(rb.getString("jedis.maxIdle")); port = Integer.parseInt(rb.getString("jedis.port")); host = rb.getString("jedis.host"); poolConfig = new JedisPoolConfig(); poolConfig.setMaxTotal(maxTotal); poolConfig.setMaxIdle(maxIdle); jedisPool = new JedisPool(poolConfig,host,port); } public static Jedis getJedis(){ Jedis jedis = jedisPool.getResource(); return jedis; } }
jedis.properties配置文件
jedis.host=localhost jedis.port=6379 jedis.maxTotal=30 jedis.maxIdle=10
本文来自博客园,作者:King-DA,转载请注明原文链接:https://www.cnblogs.com/qingmuchuanqi48/p/10724181.html