轻量级持久存储系统 MemcacheDB
2013-07-19 17:21 java20130722 阅读(411) 评论(0) 编辑 收藏 举报
注:memcached可能简称mc,memcachedb可能简称mcdb
一、memcachedb是什么
mcdb是一款分布式键值持久存储系统,由新浪开源。mcdb基于mc协议,所以可以使用mc客户端直接使用,存储引擎方面使用BerkeleyDB,支持主从复制模式。
二、memcachedb的应用场景
首先,我们从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点,当然它们肯定不只这点区别。
mc因为是非持久存储的,所以它的定位就是缓存。
而mcdb不是用来做缓存的,它是和mysql同个层次的东西。不一样的是,mcdb性能要比mysql高,而mysql检索功能比mcdb强。如果非要从缓存的角度看的话,那mc就是缓解mysql读压力,而mcdb则是缓解mysql写压力。
mcdb适合应用的场景:
1.浏览/点击/等统计,也可以局部代替mysql的count函数
2.标志,例如,JE的“我在干什么”功能
3.频繁写的地方,访客列表、评论之类的
之前,我写过的feed设计最大特点是使用mcdb来分散写压力,对sns来说动态产生太频繁了,全部写进mysql压力太大了,毕竟读/写1K和100K性能不是一样的,一台mcdb和一台mysql的成本不一样啊。。
虽然mcdb的方式比较简单,但是应用场合还是很丰富的,使用新产品要发散思维,充分发挥想象力~
不过重要的数据还是不建议使用,感觉还不是很放心。
三、安装
安装MemcacheDB之前需要安装Libevent和Berkeley Db
1.先安装libevent
下载地址: http://www.monkey.org/~provos/libevent/
2.安装Berkeley Db
下载地址:http://www.oracle.com/technology/software/products/berkeley-db/index.html
安装完后,编辑/etc/ld.so.conf把
3.安装memcachedb
下载地址:http://code.google.com/p/memcachedb/downloads/list
4.创建数据保存点
四、使用
1.单机模式
2.主从模式
测试是否同步
3.FYI:参数说明
关于-C和-N选项涉及到数据完整性,会在下面会说明一下
五、备份和恢复
1.热备份
因为memcachedb是基于bdb的,所以可以用bdb自带的热备份工具备份
恢复的话,启动memcacedb的数据目录设置成备份目录就可以了
2.单机模式crash恢复
bdb的事务处理和很多事物引擎相似,都是先写日志,数据先保存在内存。所以crash以后,可以通过日志来恢复。启动memcachedb的时候,可以使用-C选项来设置checkpoint的间隔时间,如果设置得太长,恢复时间越长。
模拟crash
3.主从模式的crash恢复
主从模式下可以考虑启用-N选项来提高性能,如果不是用-N,日志是实时写到硬盘,这也是为什么crash以后可以通过日志恢复的原因。
但是如果使用-N来提高性能是有代价的,也就是日志不实时写硬盘,那crash以后无法保证完全恢复,没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式,那就无需担心,因为当事务提交以后,会马上同步到slave。
也就是说使用-N选项后,crash后通过slave来恢复。
一、memcachedb是什么
mcdb是一款分布式键值持久存储系统,由新浪开源。mcdb基于mc协议,所以可以使用mc客户端直接使用,存储引擎方面使用BerkeleyDB,支持主从复制模式。
二、memcachedb的应用场景
首先,我们从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点,当然它们肯定不只这点区别。
mc因为是非持久存储的,所以它的定位就是缓存。
而mcdb不是用来做缓存的,它是和mysql同个层次的东西。不一样的是,mcdb性能要比mysql高,而mysql检索功能比mcdb强。如果非要从缓存的角度看的话,那mc就是缓解mysql读压力,而mcdb则是缓解mysql写压力。
mcdb适合应用的场景:
1.浏览/点击/等统计,也可以局部代替mysql的count函数
2.标志,例如,JE的“我在干什么”功能
3.频繁写的地方,访客列表、评论之类的
之前,我写过的feed设计最大特点是使用mcdb来分散写压力,对sns来说动态产生太频繁了,全部写进mysql压力太大了,毕竟读/写1K和100K性能不是一样的,一台mcdb和一台mysql的成本不一样啊。。
虽然mcdb的方式比较简单,但是应用场合还是很丰富的,使用新产品要发散思维,充分发挥想象力~
不过重要的数据还是不建议使用,感觉还不是很放心。
三、安装
安装MemcacheDB之前需要安装Libevent和Berkeley Db
1.先安装libevent
下载地址: http://www.monkey.org/~provos/libevent/
tar zxvf libevent-1.4.9-stable.tar.gz cd libevent-1.4.9-stable ./configure make make install
2.安装Berkeley Db
下载地址:http://www.oracle.com/technology/software/products/berkeley-db/index.html
tar xvzf db-4.7.25.tar.gz cd db-4.7.25/ cd build_unix/ ../dist/configure make make install
安装完后,编辑/etc/ld.so.conf把
usr/local/lib /usr/local/BerkeleyDB.4.7/lib
3.安装memcachedb
下载地址:http://code.google.com/p/memcachedb/downloads/list
- tar
xvzf 1.2.0.tar.gzmemcachedb- - cd
memcachedb-X.Y.Z - ./configure
--enable-threads - make
- make
install
tar xvzf memcachedb-1.2.0.tar.gz cd memcachedb-X.Y.Z ./configure --enable-threads make make install
4.创建数据保存点
mkdir /data/21201 -p chown -R willko:wheel
四、使用
1.单机模式
memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1
2.主从模式
- memcachedb
-p 21210-d 127.0.0.1:31210-r -u willko -H /data/21210_m -N -R -M - 主服务器,用31210来同步数据
-
- memcachedb
-p 21211-d 127.0.0.1:31211-r -u willko -H /data/21211_from_local_21210 -N -R -O 127.0.0.1:31210-S - 从服务器,主从模式-R是必须设置的。
memcachedb -p 21210 -d -r -u willko -H /data/21210_m -N -R 127.0.0.1:31210 -M 主服务器,用31210来同步数据 memcachedb -p 21211 -d -r -u willko -H /data/21211_from_local_21210 -N -R 127.0.0.1:31211 -O 127.0.0.1:31210 -S 从服务器,主从模式-R是必须设置的。
测试是否同步
- [root@srv
willko]# 127.0.0.1telnet 21210 - Trying
127.0.0.1... - Connected
to 127.0.0.1. - Escape
character '^]'.is - set
yy 00 4 - yyyy
- STORED
- get
yy - VALUE
yy 04 - yyyy
- END
[root@srv willko]# telnet 127.0.0.1 21210 Trying 127.0.0.1... Connected to 127.0.0.1. Escape character is '^]'. set yy 0 0 4 yyyy STORED get yy VALUE yy 0 4 yyyy END
- [root@srv
willko]# 127.0.0.1telnet 21211 - Trying
127.0.0.1... - Connected
to 127.0.0.1. - Escape
character '^]'.is - get
yy - VALUE
yy 04 - yyyy
- END
[root@srv willko]# telnet 127.0.0.1 21211 Trying 127.0.0.1... Connected to 127.0.0.1. Escape character is '^]'. get yy VALUE yy 0 4 yyyy END
3.FYI:参数说明
- memcachedb
1.2.0 - -p
<num> 21201TCP监听端口,默认是 - -U
<num> 0,也就是关闭。UDP监听端口,默认是 - -s
<file> 使用socket通讯,参数是设置unix socket的路径,此通讯方式只能本地使用 - -a
<mask> 0700unix socket文件的权限,默认是 - -l
<ip_addr> 监听地址,默认是 INDRR_ANY - -d
以守护进程方式运行 - -r
maximize core file limit - -u
<username> 以<username>启动,只有root才能使用,因为memcachedb不允许以root启动 - -c
<num> defaultmax simultaneous connections, is 1024 - -b
<num> defaultitem size smaller than <num> will use fast memory alloc, is 512B - -v
打印错误和警告信息 - -vv
打印整个交互过程 - -h
print help and exit - -i
print license info - -P
<file> 进程PID保存路径,只能在守护进程方式下使用 - -t
<num> 4线程数,默认是 - --------------------BerkeleyDB
Options------------------------------- - -m
<num> defaultin-memmory cache size of BerkeleyDB in megabytes, is 64MB - -A
<num> defaultunderlying page size in bytes, is 4096,(512B ~ 64KB, power-of-two) - -f
<file> 'data.db'数据文件名, 默认是 - -H
<dir> '/data1/memcachedb'数据保存目录,默认是 - -B
<db_type> 'btree'数据结构类型,有 和 'hash'两种.默认是 'btree' - -L
<num> defaultlog buffer size in kbytes, is 32KB - -C
<num> 0将实时写入硬盘,每隔多少秒checkpoint, 设置为 默认是 5分钟 - -T
<num> domemp_trickle 0every <num> seconds, for disable, defaultis 30seconds - -e
<num> defaultpercent of the pages in the cache that should be clean, is 60% - -D
<num> dodeadlock 0detecting every <num> millisecond, for disable, defaultis 100ms - -N
设置 DB_TXN_NOSYNC 标志来改善性能,但是牺牲事务的持久性。默认为 关闭 - --------------------Replication
Options------------------------------- - -R
主服务器提供同步数据的地址和端口,主从模式必须设置 - -O
从服务器同步源地址和端口 - -M/-S
以主或从服务器启动 - -n
允许从服务器数量, 默认是 - -----------------------------------------------------------------------
memcachedb 1.2.0 -p <num>TCP监听端口,默认是 21201 -U <num> UDP监听端口,默认是 0,也就是关闭。 -s <file> 使用socket通讯,参数是设置unix socket的路径,此通讯方式只能本地使用 -a <mask> unix socket文件的权限,默认是 0700 -l <ip_addr> 监听地址,默认是 INDRR_ANY -d 以守护进程方式运行 -r maximize core file limit -u <username> 以<username>启动,只有root才能使用,因为memcachedb不允许以root启动 -c <num> max simultaneous connections, default is 1024 -b <num> item size smaller than <num> will use fast memory alloc, default is 512B -v 打印错误和警告信息 -vv 打印整个交互过程 -h print this help and exit -i print license info -P <file> 进程PID保存路径,只能在守护进程方式下使用 -t <num> 线程数,默认是4 --------------------BerkeleyDB Options------------------------------- -m <num> in-memmory cache size of BerkeleyDB in megabytes, default is 64MB -A <num> underlying page size in bytes, default is 4096, (512B ~ 64KB, power-of-two) -f <file> 数据文件名, 默认是 'data.db' -H <dir> 数据保存目录,默认是 '/data1/memcachedb' -B <db_type> 数据结构类型,有 'btree' 和 'hash'两种. 默认是 'btree' -L <num> log buffer size in kbytes, default is 32KB -C <num> 每隔多少秒checkpoint, 设置为0将实时写入硬盘, 默认是5分钟 -T <num> do memp_trickle every <num> seconds, 0 for disable, default is 30 seconds -e <num> percent of the pages in the cache that should be clean, default is 60% -D <num> do deadlock detecting every <num> millisecond, 0 for disable, default is 100ms -N 设置 DB_TXN_NOSYNC 标志来改善性能,但是牺牲事务的持久性。默认为 关闭 --------------------Replication Options------------------------------- -R 主服务器提供同步数据的地址和端口,主从模式必须设置 -O 从服务器同步源地址和端口 -M/-S 以主或从服务器启动 -n 允许从服务器数量, 默认是2台 -----------------------------------------------------------------------
关于-C和-N选项涉及到数据完整性,会在下面会说明一下
五、备份和恢复
1.热备份
因为memcachedb是基于bdb的,所以可以用bdb自带的热备份工具备份
- [root@srv
willko]# 4.7/bin/db_hotbackup/usr/local/BerkeleyDB. -h 21201//data/ -b ./bak/ - -h是数据的目录
- -b是备份的目录
[root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_hotbackup -h /data/21201/ -b ./bak/ -h是数据的目录 -b是备份的目录
恢复的话,启动memcacedb的数据目录设置成备份目录就可以了
2.单机模式crash恢复
bdb的事务处理和很多事物引擎相似,都是先写日志,数据先保存在内存。所以crash以后,可以通过日志来恢复。启动memcachedb的时候,可以使用-C选项来设置checkpoint的间隔时间,如果设置得太长,恢复时间越长。
/usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/ -h是你的数据目录
模拟crash
- [root@srv
willko]# 21201memcachedb -u willko -p -d 21201/-r -H /data/ -v 21201.log>/data/ 2>&1 -P /data/ - [root@srv
willko]# 21201telnet localhost - Trying
127.0.0.1... - Connected
to localhost. - Escape
character '^]'.is - set
t 00 4 - hhhh
#设置键为t,值为hhhh的 - STORED
- get
t - VALUE
t 04 - hhhh
- END
- quit
- Connection
closed by foreign host. - [root@srv
willko]# 9kill - `cat 21201/21201.pid/data/ ` 9来模拟crash#用- - [root@srv
willko]# 4.7/bin/db_recover/usr/local/BerkeleyDB. -cf 21201/-h /data/ - recovery
100% complete - [root@srv
willko]# 21201memcachedb -u willko -p -d 21201/-r -H /data/ -v 21201.log>/data/ 2>&1 -P /data/ - [root@srv
willko]# 21201telnet localhost - Trying
127.0.0.1... - Connected
to localhost. - Escape
character '^]'.is - get
t - VALUE
t 04 - hhhh
#还可以获得crash前设置的值 - END
- quit
- Connection
closed by foreign host. - [root@srv
willko]#
[root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1-P /data/21201/21201.pid [root@srv willko]# telnet localhost 21201 Trying 127.0.0.1... Connected to localhost. Escape character is '^]'. set t 0 0 4 hhhh #设置键为t,值为hhhh的 STORED get t VALUE t 0 4 hhhh END quit Connection closed by foreign host. [root@srv willko]# kill -9 `cat /data/21201/21201.pid ` #用-9来模拟crash [root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/ recovery 100% complete [root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1 -P /data/21201/21201.pid [root@srv willko]# telnet localhost 21201 Trying 127.0.0.1... Connected to localhost. Escape character is '^]'. get t VALUE t 0 4 hhhh #还可以获得crash前设置的值 END quit Connection closed by foreign host. [root@srv willko]#
3.主从模式的crash恢复
主从模式下可以考虑启用-N选项来提高性能,如果不是用-N,日志是实时写到硬盘,这也是为什么crash以后可以通过日志恢复的原因。
但是如果使用-N来提高性能是有代价的,也就是日志不实时写硬盘,那crash以后无法保证完全恢复,没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式,那就无需担心,因为当事务提交以后,会马上同步到slave。
也就是说使用-N选项后,crash后通过slave来恢复。