Memcache简介

简介

Memcache是一个高性能的分布式的内存对象缓存系统，通过在内存里维护一个统一的巨大的hash表，它能够用来存储各种格式的数据，包括图像、视频、文件以及数据库检索的结果等。简单的说就是将数据调用到内存中，然后从内存中读取，从而大大提高读取速度。

Memcache是danga的一个项目，最早是LiveJournal 服务的，最初为了加速 LiveJournal 访问速度而开发的，后来被很多大型的网站采用。

Memcached是以守护程序方式运行于一个或多个服务器中，随时会接收客户端的连接和操作。

2特性和限制

在 Memcached中可以保存的item数据量是没有限制的，只要内存足够。

　　Memcached单进程最大使用内存为2G，要使用更多内存，可以分多个端口开启多个Memcached进程

　　最大30天的数据过期时间,设置为永久的也会在这个时间过期，常量REALTIME_MAXDELTA

　　60*60*24*30控制

　　最大键长为250字节，大于该长度无法存储，常量KEY_MAX_LENGTH 250控制

　　单个item最大数据是1MB，超过1MB数据不予存储，常量POWER_BLOCK 1048576进行控制，

　　它是默认的slab大小

　　最大同时连接数是200，通过 conn_init()中的freetotal进行控制，最大软连接数是1024，通过

　　settings.maxconns=1024 进行控制

　　跟空间占用相关的参数：settings.factor=1.25, settings.chunk_size=48, 影响slab的数据占用和步进方式

memcached是一种无阻塞的socket通信方式服务，基于libevent库，由于无阻塞通信，对内存读写速度非常之快。

　　memcached分服务器端和客户端，可以配置多个服务器端和客户端，应用于分布式的服务非常广泛。

　　memcached作为小规模的数据分布式平台是十分有效果的。

memcached是键值一一对应，key默认最大不能超过128个字节，value默认大小是1M，也就是一个slabs，如果要存2M的值（连续的），不能用两个slabs，因为两个slabs不是连续的，无法在内存中存储，故需要修改slabs的大小，多个key和value进行存储时，即使这个slabs没有利用完，那么也不会存放别的数据。

目前memcached支持C/C++、Perl、PHP、Python、Ruby、Java、C#、Postgres、Chicken Scheme、Lua、MySQL和Protocol等语言客户端。

3接口介绍

Memcache客户端包含两组接口，一组是面向过程的接口，一组是面向对象的接口，具体可以参考PHP手册

MemCache“LXXV. Memcache Functions” 这章。

Memcache面向对象的常用接口包括：

Memcache::connect -- 打开一个到Memcache的连接

Memcache::pconnect -- 打开一个到Memcache的长连接

Memcache::close -- 关闭一个Memcache的连接

Memcache::set -- 保存数据到Memcache服务器上

Memcache::get --提取一个保存在Memcache服务器上的数据

Memcache::replace --替换一个已经存在Memcache服务器上的项目（功能类似Memcache::set）

Memcache::delete -- 从Memcache服务器上删除一个保存的项目

Memcache::flush -- 刷新所有Memcache服务器上保存的项目（类似于删除所有的保存的项目）

Memcache::getStats -- 获取当前Memcache服务器运行的状态

协议分析

如果你不喜欢 php_memcache.dll 扩展或者服务器目前不支持这个扩展，那么就可以考虑自己构建.

Memcahe的客户端，要先了解Memcache协议的交互，这样才能开发自己的客户端，这里简单的分析一下Memcache的协议。（更详细的协议内容请在Memcache服务器端的源码的 doc/protocol.txt文件中）

Memcache既支持TCP协议，也支持UDP协议，不过我们这里是以TCP协议的协议作为主要考虑对象，想了解UDP协议的过程，请参考 doc/protocol.txt文件。

[ 错误指令]

Memcache的协议的错误部分主要是三个错误提示指令：

普通错误信息，比如指令错误之类的

ERROR

客户端错误

CLIENT_ERROR <错误信息>

服务器端错误

SERVER_ERROR <错误信息>

[ 数据保存指令]

数据保存是基本的功能，就是客户端通过命令把数据返回过来，服务器端接收后进行处理。

指令格式：

<命令> <键> <标记> <有效期> <数据长度>

<命令> - command name

主要是三个储存数据的三个命令， set, add, replace

set 命令是保存一个叫做key的数据到服务器上

add 命令是添加一个数据到服务器，但是服务器必须保证这个key是不存在的，能够保证数据不会被覆盖

replace 命令是替换一个已经存在的数据，如果数据不存在，就是类似set功能

<键> - key

就是保存在服务器上唯一的一个表示符，必须是跟其他的key不冲突，否则会覆盖掉原来的数据，这个key是为了能够准确的存取一个数据项目

<标记> - flag

标记是一个16位的无符号整形数据，用来设置服务器端跟客户端一些交互的操作

<有效期> - expiration time

是数据在服务器上的有效期限，如果是0，则数据永远有效，单位是秒，Memcache服务器端会把一个数据的有效期设置为当前Unix时间+设置的有效时间

<数据长度> - bytes

数据的长度，block data 块数据的长度，一般在这个个长度结束以后下一行跟着block data数据内容，发送完数据以后，客户端一般等待服务器端的返回，服务器端的返回：

数据保存成功

STORED

数据保存失败，一般是因为服务器端这个数据key已经存在了

NOT_STORED

[ 数据提取命令]

从服务器端提取数据主要是使用get指令，格式是：

get <键>*

<键>* -key

key是是一个不为空的字符串组合，发送这个指令以后，等待服务器的返回。如果服务器端没有任何数据，则是返回：

END

证明没有不存在这个key，没有任何数据，如果存在数据，则返回指定格式：

VALUE <键> <标记> <数据长度>

<数据块>

返回的数据是以VALUE开始的，后面跟着key和flags，以及数据长度，第二行跟着数据块。

<键> -key

是发送过来指令的key内容

<标记> - flags

是调用set指令保存数据时候的flags标记

<数据长度> - bytes

是保存数据时候定位的长度

<数据块> - data block

数据长度下一行就是提取的数据块内容

[ 数据删除指令]

数据删除指令也是比较简单的，使用delete指令，格式是：

delete <键> <超时时间>

<键> - key

key是你希望在服务器上删除数据的key键

<超时时间> - timeout

按照秒为单位，这个是个可选项，如果你没有指定这个值，那么服务器上key数据将马上被删除，如果设置了这个值，那么数据将在超时时间后把数据清除，该项缺省值是0，表示永不过期。

删除数据后，服务器端会返回：

DELETED

删除数据成功

NOT_FOUND

这个key没有在服务器上找到

如果要删除所有服务器上的数据，可以使用flush_all指令，格式：

flush_all

这个指令执行后，服务器上所有缓存的数据都被删除，并且返回：

这个指令一般不要轻易使，除非你确实想把所有数据都干掉，删除完以后可以无法恢复的。

[其他指令]

如果想了解当前Memcache服务器的状态和版本等信息，可以使用状态查询指令和版本查询指令。

如果想了解当前所有Memcache服务器运行的状态信息，可以使用stats指令，格式

stats

服务器将返回每行按照 STAT开始的状态信息，包括20行，20项左右的信息，包括守护进程的pid、版本、保存的项目数量、内存占用、最大内存限制等等信息。

如果只是想获取部分项目的信息，可以指定参数，格式：

stats <参数>

这个指令将只返回指定参数的项目状态信息。

如果只是想单独了解当前版本信息，可以使用version指令，格式：

version

将返回以 VERSION 开头的版本信息

如果想结束当前连接，使用quit指令，格式：

quit

将断开当前连接

另外还有其他指令，包括incr, decr 等，我也不太了解作用，就不做介绍了，如果感兴趣，可以自己去研究。

在中型网站中的应用

使用Memcache的网站一般流量都是比较大的，为了缓解数据库的压力，让Memcache作为一个缓存区域，把部分信息保存在内存中，在前端能够迅速的进行存取。那么一般的焦点就是集中在如何分担数据库压力和进行分布式，毕竟单台Memcache的内存容量的有限的。我这里简单提出我的个人看法，未经实践，权当参考。

[分布式应用]

Memcache本来支持分布式，我们客户端稍加改造，更好的支持。我们的key可以适当进行有规律的封装，比如以user为主的网站来说，每个用户都有UserID，那么可以按照固定的ID来进行提取和存取，比如1开头的用户保存在第一台Memcache服务器上，以2开头的用户的数据保存在第二台Memcache服务器上，存取数据都先按照User ID来进行相应的转换和存取。

但是这个有缺点，就是需要对User ID进行判断，如果业务不一致，或者其他类型的应用，可能不是那么合适，那么可以根据自己的实际业务来进行考虑，或者去想更合适的方法。

[ 减少数据库压力]

这个算是比较重要的，所有的数据基本上都是保存在数据库当中的，每次频繁的存取数据库，导致数据库性能急剧下降，无法同时服务更多的用户，比如MySQL，特别频繁的锁表，那么让Memcache来分担数据库的压力吧。我们需要一种改动比较小，并且能够不会大规模改变前端的方式来进行改变目前的架构。

一个用PHP编写的可视化的MemCached管理系统

MemAdmin是一款可视化的Memcached管理与监控工具，使用PHP开发，体积小，操作简单。

主要功能：

服务器参数监控：STATS、SETTINGS、ITEMS、SLABS、SIZES实时刷新；

服务器性能监控：GET、DELETE、INCR、DECR、CAS等常用操作命中率实时监控；

支持数据遍历，方便对存储内容进行监视；

支持条件查询，筛选出满足条件的KEY或VALUE；

数组、JSON等序列化字符反序列显示；

兼容memcache协议的其他服务，如Tokyo Tyrant (遍历功能除外)；

支持服务器连接池，多服务器管理切换方便简洁。

posted on 2014-06-30 10:13 鸟叔手擒大数据阅读(173) 评论(0) 收藏举报