缓存的使用

  缓存,提高访问速度的利器。工作中主要用到的是memcache和redis,它们是B/S软件,类似练习时装在机子上的Apache,它也会监听端口,可以在客户端(如在cmd上通过telnet操作Memcache)直接敲各自对应的命令来存取值,自学时可以通过这样的方式熟悉下原生命令,看看效果。它们常驻内存,得到数据后写入内存(安装软件后会占用一片内存区域),设定数据的过期时间,用到时直接从内存中读出来,因为是内存所以访问速度上有数量级的提高。lz曾今写了个非常简单的后台,完全不用缓存那种,那速度我自己看了都忍不住要咆哮:这么慢tm也能叫网页?!可那时我年幼无知,不会用缓存,当然现在也不见得好到哪儿去,但愿那时前端妹子没在心里暗自唾骂>3<......

  memcache的使用较简单,至少从命令上来看是这样。在memcache中,存储的方式是key->value,键-值对应的方式存储,类似联接数组的元素形式,可存储的类型可以是数字、字符串、数组、对象等,项目中一般会将非字符串(数字可看成是数字字符串)类型的先进行json编码或者序列化再存入缓存,取出来时则解码或者反序列化。Memcache是php专门处理memcache缓存的类,封装的主要方法是get、set、delete、flush、connect、close,即一个缓存必备的获取、设置、删除、清空、连接、关闭等。(中括号为可传参数)

add key, var, [flag], [expire] 添加一个键为key、值为var到服务端,可指定过期时间expire,0则永不过期,最长30天
get key, [flag] 从服务端获取某一或某些元素
delete key, [timeout] 在指定timeout时间内删除key对应元素,默认timeout为0立即删除
flush 清空,即删除所有元素
connect host, [port], [timeout] 连接到memcache服务器host主机的port端口,它会在脚本执行完自动关闭,也可主动关闭
close 主动关闭memcache服务端连接,但不会关闭pconnect生成的连接
set key, var, [flag], [expire] 存储键为key、值为var的元素到服务端,key存在则覆盖其值,不存在新add一个
replace key, var, [flag], [expire] 查找键为key的元素,以值var替换,查不到会报错
increment key, [value] 在键为key的元素上增加值value,value默认为1,可能改变原值
decrement key, [value] 在键为key的元素上减少值value,value默认为1,可能改变原值
addServer host, [port], [persistent], [weight], [timeout], ...... 添加一个memcache服务到连接池(保存多个memcache连接的地方)中,即建立一个到host的连接,port为端口
pconnect host, [port], [timeout] 建立到位于host主机的memcache服务器的持久连接,port为端口,脚本执行完或调用close也无法关闭这种连接

  其中有几点需要留意下:

  1. set和replace的用法区别:set几乎任何情况下,当然不是连接都失败、内存不够用等硬性原因,都是成功的,replace只是在已经存在的键的基础上进行修改,键若不存在不成功;

  2. connect方法建立的连接,要么脚本运行结束自己断开,要么调用close()方法被断开掉;

  3. increment或者的decrement方法得到的数永远是大于或等于0,如果确实计算后得到的值是小于0的则进行转化,比如int类型,32位上占4字节,则返回的值是(231-1),计算后大于或等于0的直接返回;而元素之类型为非数字(或数字字符串)的,先转为数字再计算;

  4. 当我们new一个Memcache对象并进行连接时,可以有两种方式(不讨论持久连接),$mem=new Memcache; $mem->connect('127.0.0.1', 11211); 或者使用addserver方法:$mem->addServer('127.0.0.1', 11211); 后者以向已有的连接池中添加一个Memcache服务器连接的方式建立,效果一样。

  Redis,一款强大的缓存工具,得益于在国内门户网站中的广泛使用,功能上在不断完善,现在有稳定的版本(貌似微软github上最新64位的release 2.8版本,在我工作的机子上运行不起来...),方法比memcache多得多,作为开发使用到的主要是数据的存取,而其他的事物、通信协议、集群,在一般开发个后台,不是对速度追求到极致的情况下,还是基本用不到。redis中有按操作分为以下几种类型:

  1. String:也是key-value对,主要也是对它的键对应的元素进行get、set、求长度、自增等操作,redis将添加的类型全存为字符串,即便纯数字;

  

  2. Hash:哈希表(散列表),就是数据结构中的字典,采用特定的散列算法,比如手机通讯录有几百人,以姓的第一个字母作为关键码进行排序,这样我们可以快速找到联系人,这是通过特定的映射方式,将一个字母与姓名联系起来。在redis中,创建hash表时,首先指定表名,你存在哪张表里边,然后指定一个域(field,实际就是一个变量),和它对应的值,单用cmd操作就像下面这样(在hash表hash1中存储一个域username对应值Jack,redis会自动建立username到Jack的映射),一张hash表里边可以存储多个域和对应的变量;

  

  3. List:列表,相当于数据结构的链表,通过它还可实现栈和队列,前面的string(这名字取得很怪异)存储一一对应的单个键值对,它则存多个值(没有键),重点是作为一个列表结构,它可以分别从左右(表头和表尾)进行插入和弹出变量值,求长度等一系列操作,这也是为什么称为列表,下面lpush、rpush命令就是从表左边和右边插入变量hello和world;

  

  4. Set:集合,顾名思义也可以存储多个变量值(没有键),只是符合数学上定义的集合的特性,比如集合中元素不重复,因此set中各个数据对的键名也不一样,它也可以进行并、交、差等运算(下面命令是向集合mySet添加一个值var);

  

     5. SortedSet:有序集合,可看做Set的特殊方式,在每一个SortedSet类型集合中,添加一个值(没有键)时,都要给它们指定一个称为score的变量值,有序有序,得有个字段来判定它的顺序是不,就是这个玩意儿,下面命令创建一个有序集合stset,添加一个值google.com,它的score是10。其实猜也猜得到,既然叫有序集合,既然给定了score,基本确定可以用这个来进行某些排序操作,事实也是这样;

  

  6. Key:单独对键进行操作,当然对其对应的元素值也有影响,如查看键对应元素的数据类型、键对应元素的存活时间、重置存活时间、返回所有键、正则形式查看相关键名、删除键(元素也跟着没了)等等。它不是数据类型,实际上,Redis把Hash表表名、List列表表名、集合Set名都称为键,整个集合或者表是它的值。下面是type命令查看它存储值得类型,它存储的是List列表。

  

  上面这些命令,找个参考文档走一遍,很快就能玩熟,个人在这儿也只是泛泛而谈。那么在实际项目中,通常是怎样使用缓存呢?不往大的谈,比如微博的缓存设计,这可能涉及到架构层面的东西了,单说作为一个有一定访问量的后台,又想使用缓存来提高速度的情况下。

  一个重要的原则(个人目前碰得多的情况)是,以传入的参数来拼键名,以这个键名来存取值。比如现在Model模型类里面有个方法:getUserInfoByUid($params),传入包含uid字段的数组查询这个用户的信息,在这儿使用缓存,先取缓存数据,取不到则去查数据库,然后重新加入缓存,最后返回结果数据,这也是使用缓存的一个通用流程。

  以Memcache为例,先看代码,定义一个Cache类:

    /**
     * Memcache缓存类
     */
    define('CACHE_HOST', '127.0.0.1');
    define('CACHE_PORT', 11211);
    
    class Cache{
        private static $instance = null;  
        
        private $_cache = null;  // 缓存操作对象
        
        const prefix = 'APP|';  // 缓存键值的前缀,为该项目名称 
        
        private function __construct(){
            if($this->_cache === null){
                try{
                    $this->_cache = new Memcache;
                    if(!$this->_cache->connect(CACHE_HOST, CACHE_PORT)){
                        exit('connect failed');
                    }
                    
                }
                catch(Exception $e){
                    echo 'ERROR: '.$e->getMessage();
                }
                
            }
        }
        /** 
         * 返回单例
         */
        public static function getInstance(){
            if(self::$instance === null){
                self::$instance = new self();
            }
            return self::$instance;
        }
        /**
         * 生成键名
         */
        private function genKey($key){
            return Cache::prefix.$key;
        }
        
        public function __destruct(){
            if($this->_cache !== null){
                return $this->_cache->close();
            }
        }
        /**
         * 添加元素,设置过期时间
         */
        public function add($key, $val, $expire = 3600){
            return $this->_cache->add($this->genKey($key), $val, 0, $expire);
        }
        /**
         * 重置元素
         */
        public function set($key, $val, $expire = 3600){
            echo 'cache key: '.$this->genKey($key).'<br/>';  // test
            return $this->_cache->set($this->genKey($key), $val, 0, $expire);
        }
        /**
         * 获取元素
         */
        public function get($key){
            return $this->_cache->get($this->genKey($key));
        }
        /**
         * 自增
         */
        public function increment($key, $val = 1){
            return $this->_cache->increment($this->genKey($key), $val);
        }
        /**
         * 自减
         */
        public function decrement($key, $val = 1){
            return $this->_cache->decrement($this->genKey($key), $val);
        }
        /**
         * 删除元素
         */
        public function delete($key, $timeout = 0){
            return $this->_cache->delete($this->genKey($key), $timeout);
        }
        /**
         * 删除所有元素
         */
        public function flush(){
            return $this->_cache->flush();
        }    
    }

   然后定义一个操作数据库操作类:

    /**
     * 数据库操作
     */
    define('DB_NAME', 'test');
    define('DB_HOST', '127.0.0.1');
    define('DB_PORT', 3306);
    define('DB_USER', 'root');
    define('DB_PASS', '1234');
    
    class Dal{
        private static $instance = null;
        
        public $pdo = null;        
        
        private function __construct(){
            try{
                $dsn = 'mysql:dbname='.DB_NAME.';host='.DB_HOST.':'.DB_PORT;
                $this->pdo = new PDO($dsn, DB_USER, DB_PASS);
            }
            catch(PDOException $e){
                echo 'Error: '.$e->getMessage();
                return false;
            }
        }
        //获取实例
        public static function getInstance(){
            if(self::$instance === null){
                self::$instance = new self();
            }
            return self::$instance;
        }
        // 获取用户信息
        public function getUserInfoByUid($uid){
            $sql = sprintf('select * from tab1 where uid = %s limit 1', $uid);
            $stmt = $this->pdo->query($sql);
            return $stmt->fetch(PDO::FETCH_ASSOC);
        }
    }

  而一般来说,通常是在Model模型类中才对数据进行读写,因此再定义一个UserModel类,尽量从简,不再去写可能会有的Model公共基类。

    include 'Dal.php';
    include 'Cache.php';
    
    class UserModel{
        private static $instance = null;
        
        public $cache = null;
        
        public $db = null;
        
        // 缓存键名部分,通过函数名称及参数拼接
        const cache_get_userinfo_uid = 'GET|USER|INFO|BY|UID|%s';
        
        private function __construct(){
            // 获取对应类实例
            $this->cache = Cache::getInstance();
            $this->db = Dal::getInstance();
        }
        
        public static function getInstance(){
            if(self::$instance === null){
                self::$instance = new self();
            }
            return self::$instance;
        }
        
        /**
         根据uid获取用户信息
         */
        public function getUserInfoByUid($params, $timeout = 3600){
            // 缺少必要参数uid,返回
            if(empty($params['uid'])){
                return null;
            }
    
            // 拼接缓存键名
            $key = sprintf(self::cache_get_userinfo_uid, $params['uid']);
                    
            // 获取缓存数据
            $data = json_decode($this->cache->get($key), true);
            
            echo 'cache=><pre>';
            var_dump($data);
            
            // 缓存为空
            if(!$data){
                $data = $this->db->getUserInfoByUid($params['uid']);
                if(empty($data)){
                    return null;
                }
                // 在数据库中获取到数据后,重新写入缓存
                $this->cache->set($key, json_encode($data), $timeout);
            }
            return $data;
        }
    }
    // 测试
    $data = UserModel::getInstance()->getUserInfoByUid(array('uid'=>17653), 5);
    echo 'UserModel=><pre>';
    var_dump($data);

  这里,我们要通过用户的uid获取一个用户的信息,这个查询条件是uid,传过来的必要参数是uid,本来我们就是要缓存每个用户的数据,以期在重复查询时速度更快,因此在定义缓存的键时,就可以考虑使用uid。但是单单使用这个uid不行,因为假如其他的表中也有根据uid查询的,就会出现键名重复,造成了数据混乱,好我们使用的是getUserInfoByUid这个方法,可以把方法名也拼进去,因此在UserModel类中,定义了一个常量cache_get_userinfo_uid,它最后的%s就是为了拼接参数uid。但是,这样可能还是不行,现在公司启动了另外一个项目,也要用到这个表,某人写的方法跟这个方法名完全一样,毕竟函数名字又没有专利,而且运维一般单独拿服务器出来作为缓存使用,几个项目公用一台服务器,数据写在一个缓存池里也正常,此时可以考虑再加个前缀---工程名称(或说项目),因此,在Cache类中,又定义了一个常量prefix,给这个项目叫APP,这样基本就可以保证不会冲突了。当然如果这是一个组的子项目,这个组还有其他项目,这个组叫Star的话,可以再将项目组名称加在前面。

  看看效果,第一次(左边)运行读取cache是空的,但是可以看到打印的缓存键名,

           

  第二次(右边)cache就有数据了,因为我把打印缓存键名的地方放在Cache类的set方法中,第二次直接读到了缓存数据,没有去连数据库,自然也没有重置缓存,所以没打印cache key。

  扯了半天就是要保证键名不冲突,也夹杂了一般在一个项目中怎样使用缓存,有几个供参考的方式:

  1. 当前参数,可以有几个拼接几个,这里只举了个uid,假如还有name, age等等,可以都放在后面,具体怎么弄看个人喜好或者代码规范;

  2. 当前方法名称,尽量接近当前方法名称,拼在缓存key中间;

  3. 当前项目名称作为前缀(可选),更安全;

  4. 所在项目组名称,再次作为前缀拼进来(一般用不到)。

  然后就是,在Model模型类中,先取缓存,取不到则读数据库,读到后不要忘了写入缓存,设置好过期时间等细节,就这么一个流程。

  当然你还可以做得更加细致,比如读取到缓存数据后,再检测下它的过期时间,发现还有5秒就要过期了,于是我们重新给它设置为3000秒,这样下次访问时又能取到了,不至于下次又读库,频繁地连接数据库是很耗时的一件事。

  不过我还是觉得Redis好用,Redis中的Hash表最好的啦>-_-<,但恰好机子上还没配。

  唔......不早了,洗洗睡~=_=

 

posted @ 2015-01-31 00:03  lazycat-cz  阅读(2482)  评论(0编辑  收藏  举报