轻量级别的Cache和反向代理软件---Varnish

1、Varnish描述

1.1 Varnish的结构与特点

Varnish是一个轻量级别的Cache和反向代理软件，先进的设计理念和成熟的设计框架是Varnish的主要特点：

基于内存进行缓存，重启后数据将消失
利用虚拟内存方式，I/O性能好.
支持设置0~60秒的精确缓存时间
VCL配置管理比较灵活
32位机器上缓存文件大小为最大2GB
具有强大的管理功能，例如：top stat admin list等
状态设计巧妙，结构清晰
利用二叉堆管理缓存文件，达到可以积极删除目的。

1.2 Varnish与Squid的对比

说到Varnish，就不能不提Squid，Squid是一个高性能的代理缓存服务器，它和Varnish的相比较有诸多的异同点，下面进行分析：

相同点：

l 都是一个反向代理服务器

l 都是开源软件

异同点，也是Varnish的优点:

l Varnish的稳定性很高，两者在完成相同的负荷的工作时，Squid发生的故障几率要高于Varnish，因为Squid需经常重启.

l Varnish访问速度更快，Varnish采用用了”Visual Page Cache”技术，所有缓存的数据都直接从内存读取，而且Squid是从硬盘读取缓存数据，因此Varnish访问速度更快

l Varnish可以支持更多的并发连接，因为Varnish的TCP连接要比Squid释放快，所以在高并发连接情况可以支持更多地TCP连接。

l Varnish可以通过管理端口，使用证则表达式清除部分缓存，而Squid做不到。

Varnish缺点如下：

l 在高并发状态下CPU,I/O和内存等资源开销都要高于Squid。

l Varnish进程一旦挂起，崩溃或者重启，缓存数据都会从内存当中完全释放，此时所有的请求会发送后端的WEB服务器，在高并发的情况下，这会给后端的服务器造成很大压力。

2、Varnish安装

2.1、安装前环境

Varnish-Server1 à10.0.0.201

Web—Server2à10.0.0.202

2.2、创建Varnish用户缓存目录和日志

# useradd varnish -s /sbin/nologin 创建varnish用户

# mkdir /varnish/cache –p 创建varnish缓存目录

# mkdir /varnish/log 创建varnish日志

# chown -R varnish:varnish /varnish/ 修改赋权组

2.3、安装PCRE

为了兼容正则表达式，编译 2.0以上版本时否则会报错pcre找不到。

# yum install gcc

# yum install gcc-c++ libstdc++-devel

# yum install -y httpd-devel pcre perl pcre-devel zlib zlib-devel GeoIP GeoIP-devel

# wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.34.tar.bz2

# tar -xvf pcre-8.34.tar.bz2

# cd pcre-8.34/

# ./configure --prefix=/usr/local/prce/

# make && make install

注：如果你在编译的vasnish中的bin目录没有发现varnishstat, varnishtop, varnishhist这个三个程序的话，是因为编译前没有安装与操作系统位数对应的ncurses-devel 安装ncurses-devel

yum install ncurses-devel.x86_64

然后再次编译varnish 即可

2.4、安装Varnish

# wget http://repo.varnish-cache.org/source/varnish-3.0.0.tar.gz

# tar -xzvf varnish-3.0.0.tar.gz

# cd varnish-3.0.0

#./configure --prefix=/usr/local/varnish PKG_CONFIG_PATH=/usr/lib/pkgconfig

# make && make install

# cd /usr/local/varnish/sbin

./varnishd -V

3、Varnish配置

3.1、VCL使用说明

VCL，即Varnish Configaution Language 用来定义Varnish的存储策略

VCL内置函数

(1)、vcl_recv函数

用于接收和处理请求，当请求到达并成功接收后被调用.

函数一般以如下几个关键字结束

pass表示进入pass模式，把请求控制权交给vcl_pass函数

pige 表示进入pige模式，把请求控制权交给vcl_pipe函数

error code[reason] 表示返回”code”给客户，并放弃处理该请求，”code”是错误的标识

，例如：200和405等，”reason”是错误信息

(2)、vcl_pipe函数

此函数在进入pipe模式时被调用，用于请求直接传至后端主机，在请求和返回内容没有改变的情况下，将不变的内容返回给客户端，直到这个连接被关闭。

此函数一般以如下几个关键字结束：

error code[reason]

pipe

(3)、vcl_pass函数

此函数在进入pass模式时被调用，用于请求直接传至后端主机，后端主机但应数据，将答应的数据传至客户端，但不进行任何缓存，当前连接下每次都返回最新的内容。

此函数一般以如下几个关键字结束：

error code[reason]

pass

(4)、lookup函数

表示在缓存中查找被请求的对象，并且根据查找的结果把控制权交给vcl_hit或者函数vcl_miss

(5)、vcl_hit函数

在执行lookup指令后，在缓存中找到请求的内容后将自动调用该函数

此函数一般以如下几个关键字结束：

fetch 表示从后端获取请求的内容，并且把控制权交给vcl_fetch函数

deliver 表示将找到的内容发送给客户，并且把控制权交给函数vcl_deliver

error code[reason]

pass

(6)、vcl_miss函数

在执行lookup指令后，在缓存中没有找到请求的内容时自动调用该方法，此函数可以于判断是否需要从后端服务器获取内容

此函数一般以如下几个关键字结束：

fetch：表示从后端获取请求内容，并且把控制权交给vcl_fetch函数

error code[reason]

pass

(7)、vcl_miss函数

在后端主机更新缓存并且获取内容后调用该方法，接着，通过判断获取的内容来决定是将内容放入缓存，还是直接返回给客户端，

此函数一般以如下几个关键字结束：

error code[reason]

pass

deliver

(8)、vcl_deliver函数

将在缓存中找到请求的内容发送给客户端调用此方法。

此函数一般以如下几个关键字结束：

error code[reason]

deliver

(9)、vcl_timeout函数

在缓存内容到期前调用此函数.

此函数一般以如下几个关键字结束：

discard：表示从缓存中清除内容

fetch

(10)、vcl_discard函数

在缓存内容到期后或者缓存空间不足时，自动调用该函数.

此函数一般以如下几个关键字结束：

keep:表示将内容继续保留在缓存当中

discard

2.3.2、配置Varnish配置实战

由于本版不同，Varnish配置文件的写法也存在一定的差异，Varnish3.x版本不但在配置写法上和2.x版本不同，修复了很多不应用BUG，本文以3.x版本为基准

Varnish安装完成后，默认的配置文件/usr/local/varnish/etc/varnish/default.vcl

此配置文件默认是全部注释掉的.配置文件如下：

先编辑配置文件

# vi /usr/local/varnish/etc/varnish/default.vcl

# This is a basic VCL configuration file for varnish.  See the vcl(7)

# man page for details on VCL syntax and semantics.

#

# Default backend definition.  Set this to point to your content

# server.

#

 

# This is a basic VCL configuration file for varnish.  See the vcl(7)

# man page for details on VCL syntax and semantics.

#

# Default backend definition.  Set this to point to your content

# server.

#

#设置后端WEB服务

backend webtest1 {

    .host = "10.0.0.202";

    .port = "80";

    .connect_timeout = 1s;

    .first_byte_timeout = 5s;

    .between_bytes_timeout = 2s;

}

#可以定义多台WEB

#backend webtest2 {

#    .host = "192.168.100.6";

#    .port = "80";

#    .connect_timeout = 1s;

#    .first_byte_timeout = 5s;

#    .between_bytes_timeout = 2s;

#}

#多台WEB可以定义负载均衡

#director lb_test random {

#    {

#      .backend = webtest1;

#      .weight = 5;

    # }

    # {

    #   .backend = test2;

    #   .weight = 5;

    # }

 

#}

#定义那些IP或者IP段具有访问权

acl purge {

    "localhost";

    "127.0.0.1";

    "192.168.1.0"/24;

    "10.0.0.0"/16;

}

 

 

sub vcl_recv {

#开启压缩模式，图片格式取消压缩

if (req.http.Accept-Encoding) {

    if (req.url ~ "\.(jpg|png|gif|jpeg|flv)" ) {

        remove req.http.Accept-Encoding;

        remove req.http.Cookie;

    } else if (req.http.Accept-Encoding ~ "gzip") {

        set req.http.Accept-Encoding = "gzip";

    } else if (req.http.Accept-Encoding ~ "deflate") {

        set req.http.Accept-Encoding = "deflate";

    } else {

        remove req.http.Accept-Encoding;

    }

}

#根据host设置后端服务器

  if (req.http.Host ~ "(?i)(www.test1.com|www.test2.com|10.0.0.201)") {

     #set req.backend = lb_test; #如果开启负载用此项

     set req.backend = webtest1;

   }else

  if (req.http.Host ~ "(?i)image.wdj.com"){

     set req.backend = webtest1;

  }else

  {

    error 408 "Hostname not found";

  }

#如果为purge请求，客户端ip不在访问列表中，返回405拒绝

  if (req.request == "PURGE") {

     if (!client.ip ~purge) {

       error 405 "Not Allowed";

   }

#本地缓存查找

   return(lookup);

  }

#如果为GET请求，url后缀为jpg,png,gif等 取出cookie

  if (req.request == "GET"&&req.url ~ "(?i)\.(jpg|png|gif|swf|jpeg|ico)$") {

        unset req.http.cookie;

  }

#如果GET请求，url为php，则穿过cache，不缓存

  if (req.request =="GET"&&req.url ~ "(?i)\.php($|\?)"){

        return (pass);

  }

#简单防盗链

if (req.http.referer ~ "http://.*") {

  if ( !(req.http.referer ~ "http://.*test1\.com"

     || req.http.referer ~ "http://.*test2\.com"

     || req.http.referer ~ "http://.*wdj\.com"

     || req.http.referer ~ "http://.*google\.com"

     || req.http.referer ~ "http://.*baidu\.com"

     || req.http.referer ~ "http://.*yahoo\.cn"

  )) {

      error 404 "Not Found!";

 }

}

#获取客户端ip

#     if (req.restarts == 0) {

        if (req.http.x-forwarded-for) {

            set req.http.X-Forwarded-For =

                req.http.X-Forwarded-For + ", " + client.ip;

        } else {

            set req.http.X-Forwarded-For = client.ip;

        }

#   }

#不是以下请求进入pipe模块

    if (req.request != "GET" &&

      req.request != "HEAD" &&

      req.request != "PUT" &&

      req.request != "POST" &&

      req.request != "TRACE" &&

      req.request != "OPTIONS" &&

      req.request != "DELETE") {

        /* Non-RFC2616 or CONNECT which is weird. */

        return (pipe);

    }

#不是GET 和HEAD请求不缓存

    if (req.request != "GET" && req.request != "HEAD") {

        /* We only deal with GET and HEAD by default */

        return (pass);

    }

    if (req.http.Authorization) {

        /* Not cacheable by default */

        return (pass);

    }

    return (lookup);

}

#

 sub vcl_pipe {

     return (pipe);

 }

#

sub vcl_pass {

    return (pass);

}

#使用url+host hash算法查找数据

sub vcl_hash {

    hash_data(req.url);

    if (req.http.host) {

        hash_data(req.http.host);

    } else {

        hash_data(server.ip);

    }

    return (hash);

}

# 如果请求为purge 将清除缓存

sub vcl_hit {

   if (req.request == "PURGE") {

       set obj.ttl = 0s;

       error 200 "Purged";

    }

    return (deliver);

}

 

sub vcl_miss {

    return (fetch);

}

#

sub vcl_fetch {

    if (beresp.ttl <= 0s ||

        beresp.http.Set-Cookie ||

        beresp.http.Vary == "*") {

                /*

                 * Mark as "Hit-For-Pass" for the next 2 minutes

                 */

                set beresp.ttl = 0 s;

                return (hit_for_pass);

    }

    if (beresp.http.Pragma ~"no-cache" ||

    beresp.http.Cache-Control ~"no-cache" ||

    beresp.http.Cache-Control ~"private") {

      return (deliver);

   }

#为特定格式文件设置缓存时间，有多种的可以直接在后米啊加

    if (req.request == "GET"&&req.url ~ "(?i)\.(js|css|mp3|jpg|png|gif|swf|jpeg|ico)$") {

    set beresp.ttl = 30d;

  }

   if (req.request == "GET"&&req.url ~ "(?i)\.(html|htm)$") {

    set beresp.ttl = 1d;

  }

    return (deliver);

}

# 设置返回状态

 sub vcl_deliver {

     set resp.http.x-hits = obj.hits;

     if (obj.hits > 0) {

      set resp.http.X-Cache = "Hit test.com";

   }else {

       set resp.http.X-Cache = "Miss test.com";

   }

     set resp.http.Server = "BWM";

     return (deliver);

 }

# 定义错误

sub vcl_error {

    set obj.http.Content-Type = "text/html; charset=utf-8";

    set obj.http.Retry-After = "5";

    synthetic {"

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<html>

  <head>

    <title>"} + obj.status + " " + obj.response + {"</title>

  </head>

  <body>

    <h1>Error "} + obj.status + " " + obj.response + {"</h1>

    <p>"} + obj.response + {"</p>

    <h3>Guru Meditation:</h3>

    <p>XID: "} + req.xid + {"</p>

    <hr>

    <p>Varnish cache server</p>

  </body>

</html>

"};

    return (deliver);

}

 

sub vcl_init {

        return (ok);

}

 

sub vcl_fini {

        return (ok);

}

default.vcl

4、Varnish运行

4.1、varnish启动

-u 以什么用运行
-g 以什么组运行
-f varnish配置文件
-a 绑定IP和端口
-s varnish缓存文件位置与大小
-w 最小，最大线程和超时时间
-t 缓存时间s
-T varnish管理端口，主要用来清除缓存
-p client_http11=on 支持http1.1协议
-P(大P) /usr/local/varnish/var/varnish.pid 指定其进程码文件的位置，实现管理
停止varnish

varnish两种缓存方式：

(1)基于malloc内存+swap交换模式

/usr/local/varnish/sbin/varnishd -f /usr/local/varnish/etc/varnish/default.vcl -s malloc,200M -a 10.0.0.201:80 -w 1024,512000,10 -t 10.0.0.201:3000

(2)基于file是mmap的文件内存映射的机制.

/usr/local/varnish/sbin/varnishd -u varnish -g varnish -f /usr/local/varnish/etc/varnish/default.vcl -a 10.0.0.201:80 -s file,/varnish/cache/varnish_cache.data,1G -w 1024,51200,10 -t 3600 -T 10.0.0.201:3000

企业里里面开启为100G

4.2、启动日志

# /usr/local/varnish/bin/varnishncsa -w /varnish/log/varnish.log &

日志加入开机启动:

echo "/usr/local/varnish/bin/varnishncsa -w /data/varnish/logs/varnish.log &" >> /etc/rc.local
参数: -w 指定varnish访问日志要写入的目录与文件

4.3、缓存验证：

可以通过浏览器访问对应的网页来查看Varnish缓存的效果。如果Varnish缓存成功，第二次打开网页的速度会明显比第一次快，但是这种方式并不能够充分说明问题。下面用命令行方式，通过查看网页头来查看命中情况。

[root@varnish-server ~]# curl -I http://www.ixdba.net/a/mz/2010/0421/11.html
HTTP/1.1 200 OK
Server: Apache/2.2.14 (Unix) PHP/5.3.1 mod_perl/2.0.4 Perl/v5.10.1
Last-Modified: Sat, 10 Jul 2010 11:25:15 GMT
ETag: "5e850b-616d-48b06c6031cc0"
Content-Type: text/html
Content-Length: 24941
Date: Fri, 09 Jul 2010 08:29:16 GMT
X-Varnish: 1364285597
Age: 0
Via: 1.1 varnish
Connection: keep-alive
X-Cache: MISS from www.ixdba.net #这里的“MISS”表示此次访问没有从缓存读取

再次打开这个页面，查看网页的头信息。

·  [root@varnish-server ~]# curl -I http://www.ixdba.net/a/mz/2010/0421/11.html

·  HTTP/1.1 200 OK

·  Server: Apache/2.2.14 (Unix) PHP/5.3.1 mod_perl/2.0.4 Perl/v5.10.1

·  Last-Modified: Sat, 10 Jul 2010 11:25:15 GMT

·  ETag: "5e850b-616d-48b06c6031cc0"

·  Content-Type: text/html

·  Content-Length: 24941

·  Date: Fri, 09 Jul 2010 08:30:35 GMT

·  X-Varnish: 1364398612 1364285597

·  Age: 79

·  Via: 1.1 varnish

·  Connection: keep-alive

·  X-Cache: HIT from www.ixdba.net     #由“HIT”可知，第二次访问此页面时，从缓存中读取内容，也就是缓存命中

参考URL：http://book.51cto.com/art/201202/314875.htm

5、Varnish 日志切割

5.1、日志切割

# vim /data/shell/cut_varnish_log.sh

#!/bin/sh
logs_path=/varnish/logs
vlog=${logs_path}/varnish.log
date=$(date -d "yesterday" +"%Y-%m-%d")
pkill -9 varnishncsa
mkdir -p ${logs_path}/$(date -d "yesterday" +"%Y")/$(date -d "yesterday" +"%m")/
mv /varnish/logs/varnish.log ${logs_path}/$(date -d "yesterday" +"%Y")/$(date -d "yesterday" +"%m")/varnish-${date}.log
/usr/local/varnish/bin/varnishncsa -w /varnish/logs/varnish.log &

使用计划任务,每天晚上凌晨00点运行日志切割脚本

echo "0 0 * * * /data/shell/cut_varnish_log.sh" >> /etc/crontab

6、Varnish日常管理

6.1、日常管理

/usr/local/varnish/bin/varnishadm -T 10.0.0.201:3000 purge "req.http.host ~ www.server110.com$ && req.url ~ /static/image/tp.php"
详细介绍：
10.0.0.201:3000 ###为被清除缓存服务器地址
www.server201.com ###为被清除的域名
/static/image/tp.php ###为被清除的url地址列表
清除所有缓存
/usr/local/varnish/bin/varnishadm -T 192.168.9.201:3000 ban.url ^.*$
清除image目录下所有缓存
/usr/local/varnish/bin/varnishadm -T 192.168.9.201:3000 ban.url /image/
查看Varnish服务器连接数与命中率
/usr/local/varnish/bin/varnishstat –n /varnish/cache/varnish_cache.data

7、Varnish内置公用变量

公用变量名称    含义
req.backend        指定对应的后端主机
server.ip              表示服务器端IP
client.ip               表示客户端IP
req.request          指定请求的类型，例如GET、HEAD、POST等
req.url                 指定请求的地址
req.proto            表示客户端发起请求的HTTP协议版本
req.http.header   表示对应请求中的http头部信息
req. restarts         表示请求重启的次数，默认最大值为4
Varnish               在向后端主机请求时，可以使用的公用变量如表3所示：
表3
公用变量名称含义
beresp.request 指定请求的类型，例如GET、HEAD等
beresp.url 指定请求的地址
beresp .proto 表示客户端发起请求的HTTP协议版本
beresp .http.header 表示对应请求中的http头部信息
beresp .ttl 表示缓存的生存周期，也就是cache保留多长时间，单位是秒
从cache或者后端主机获取内容后，可以使用的公用变量如表4所示：
表4
公用变量名称含义
obj.status 表示返回内容的请求状态代码，例如200、302、504等
obj.cacheable 表示返回的内容是否可以缓存，也就是说，如果HTTP返回是200、203、300、301、302、404、410等，并且有非0的生存期，则可以缓存
obj.valid 表示是否是有效的HTTP应答
obj.response 表示返回内容的请求状态信息
obj.proto 表示返回内容的HTTP协议版本
obj.ttl 表示返回内容的生存周期，也就是缓存时间，单位是秒
obj.lastuse 表示返回上一次请求到现在的间隔时间，单位是秒
对客户端应答时，可以使用的公用变量如表5所示：
表5
公用变量名称含义
resp.status 表示返回给客户端的HTTP状态代码
resp.proto 表示返回给客户端的HTTP协议版本
resp.http.header 表示返回给客户端的HTTP头部信息
resp.response 表示返回给客户端的HTTP状态信息
在上面的讲述中，我们只是介绍了常用的VCL内置公用变量，如果需要了解和使用更多的公用变量信息，请登录varnish官方网站查阅。

posted on 2016-09-07 18:01 losbyday 阅读(2540) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架