Squid 代理服务器(传统代理、透明代理、acl控制、sarg日志分析、反向代理)
一。Squid服务器
Squid 主要提供缓存加速、应用层过滤控制的功能。
代理的工作机制
1. 代替客户机向网站请求数据,从而可以隐藏用户的真实IP地址。
2. 将获得的网页数据(静态 web 元素)保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应。
代理服务器的概念及其作用
代理服务器是一个位于客户端和原始(资源)服务器之间的服务器,为了从原始服务器取得内容,客户端向代理服务器发送一个请求并指定目标原始服务器, 然后代理服务器向原始服务器转交请求并将获得的内容返回给客户端。
其主要作用有:
资源获取∶代替客户端实现从原始服务器的资源获取;
加速访问∶代理服务器可能离原始服务器更近,从而起到一定的加速作用;
缓存作用∶代理服务器保存从原始服务器所获取的资源,从而实现客户端快速的获取
隐藏真实地址∶代理服务器代替客户端去获取原始服务器资源, 从而隐藏客户端真实信息。
Squid 代理的类型
传统代理∶适用于Internet, 需在客户机指定代理服务器的地址和端口。
透明代理∶客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将web访问重定向给代理服务器处理。
反向代理∶如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端,否则反向代理服务器将向后台的 WEB 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。
二。源码编译安装Squid服务
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
1. 编译安装 Squid
yum -y install gcc gcc-c++ make #准备安装环境 cd /opt tar zxvf squid-3.5.28.tar.gz -C /opt/ cd /opt/squid-3.5.28 ./configure --prefix=/usr/local/squid \ #指定安装目录路径 --sysconfdir=/etc \ #指定配置文件路径 --enable-arp-acl \ #MAC地址管控,防止客户端使用IP欺骗 --enable-linux-netfilter \ #使用内核过滤 --enable-linux-tproxy \ #支持透明代理模式 --enable-async-io=100 \ #异步IO,提升存储性能 --enable-err-language="Simplify_Chinese" \ #错误信息的显示语言(简体中文) --enable-underscore \ #允许URL中有下划线 --disable-poll \ #关闭默认使用poll模式 --enable-epoll \ #开启epoll模式提升性能 --enable-gnuregex #使用GNU正则表达式 ------------------------------------------------------------------------- ./configure --prefix=/usr/local/squid \ --sysconfdir=/etc \ --enable-arp-acl \ --enable-linux-netfilter \ --enable-linux-tproxy \ --enable-async-io=100 \ --enable-err-language="Simplify_Chinese" \ --enable-underscore \ --disable-poll \ --enable-epoll \ --enable-gnuregex make -j 2 && make install
ln -s /usr/local/squid/sbin/*/usr/local/sbin/ #建立软链接使用squid命令
useradd -M -s /sbin/nologin squid #不建立宿主目录,无法登录系统,只作为服务使用用户
chown -R squid:squid /usr/local/squid/var/ #此目录用于存放缓存文件
2. 修改 Squid 的配置文件
vim /etc/squid.conf
......
--- 56行 ---插入
http_access allow all #放在http_access deny all之前,允许任意客户机使用代理服务,控制规则自上而下匹配,则下一条拒绝所有不会执行
http_access deny all
http_port 3128 #用来指定代理服务监听的地址和端口(默认的端口号为 3128)
--- 61行 ---插入
cache_effective_user squid #添加,指定程序用户,用来设置初始化、运行时缓存的账号,否则启动不成功
cache_effective_group squid #添加,指定账号基本组
coredump_dir /usr/local/squid/var/cache/squid #指定缓存文件目录
3. Squid的运行控制
squid -k parse #检查配置文件语法是否正确
#启动 squid,第一次启动 squid 服务时,会自动初始化缓存目录
squid -z #-z 选项用来初始化缓存目录
squid #启动 squid 服务
#squid -k kill 进程号 #关闭服务
netstat -anpt | grep "squid" #验证服务是否开启
4. 创建Squid服务脚本
vim /etc/init.d/squid
#!/bin/bash
#chkconfig: 2345 90 25
PID="/usr/local/squid/var/run/squid.pid"
CONF="/etc/squid.conf"
CMD="/usr/local/squid/sbin/squid"
case "$1" in
start)
netstat -natp | grep squid &> /dev/null
if [ $? -eq 0 ]
then
echo "squid is running"
else
echo "正在启动 squid..."
$CMD
fi
;;
stop)
$CMD -k kill &> /dev/null
rm -rf $PID &> /dev/null
;;
status)
[ -f $PID ] &> /dev/null
if [ $? -eq 0 ]
then
netstat -natp | grep squid
else
echo "squid is not running"
fi
;;
restart)
$0 stop &> /dev/null
echo "正在关闭 squid..."
$0 start &> /dev/null
echo "正在启动 squid..."
;;
reload)
$CMD -k reconfigure
;;
check)
$CMD -k parse
;;
*)
echo "用法:$0{start|stop|status|reload|check|restart}"
;;
esac
#chkconfig: 2345 90 25的2345是默认自启动级别,如果-代表任何级别都不自启动,90是启动优先级,25是关闭优先级,优先级范围0-100,数字越大优先级越低
chmod +x /etc/init.d/squid
chkconfig --add squid #添加到系统服务
#chkconfig --level 35 squid on #设置自启动级别,不设置使用的是脚本设置
service squid status #查看服务状态
三。构建传统代理服务
客户端通过提前设置代理服务器对web服务进行访问,squid对web服务器隐藏了客户端的真实ip地址,并且加快了响应速度,如果客户端请求的资源在squid服务器缓存中,将快速回应客户端无需多次向web服务器发送请求
配置环境
主机 |
IP地址 |
所需软件、工具 |
Squid服务器 |
192.168.150.20 |
squid-3.5.28 |
Web 服务器 |
192.168.150.25 |
http |
客户机 |
192.168.150.60 |
|
配置思路
(1)Squid服务器可以配置代理相应的缓存参数对服务进行优化
(2)Squid服务器需要对防火墙的转发规则进行修改,允许转发所有入站数据
(3)web服务器安装web服务并可自定义页面信息
(4)客户端需要指定代理服务器的IP及端口
1. 修改配置信息增加代理优化参数
vim /etc/squid.conf
......
http_access allow all
http_access deny all
http_port 3128
cache_effective_user squid
cache_effective_group squid
--63行--插入优化参数
cache_mem 64 MB #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
reply_body_max_size 10 MB #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示默认设置0表示不进行限制
maximum_object_size 4096 KB #允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户
service squid restart
2. 修改防火墙规则
iptables -F
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT #允许转发所有入站的数据包
3. web服务器配置web服务
yum -y install httpd
vim /var/www/html/index.html
<html><body><h1>this is web con</h1>
<img src="gtx.jpg"/>
</body></html>
systemctl start httpd
4. 客户机使用代理访问
#客户机的代理配置(win10)打开浏览器,设置-->高级-->代理设置-->手动开启代理服务器-->保存
(地址∶ Squid服务器IP地址,端口: 3128)
5. 分析日志文件信息和数据包报文
#动态查看Squid服务器访问日志的新增记录
tail -f /usr/local/squid/var/logs/access.log
#动态查看web服务器访问日志的新增记录
tail -f /var/log/httpd/access_log
6. 抓取数据信息进行分析
tcpdump tcp -i ens33 -t -s 0 -c 50 -w ./squid.cap
sz squid.cap #传入到windows系统中
四。构建透明代理服务器
客户端不知道中间有squid代理服务器的存在,不需要设置客户端的代理服务,正常对web服务发起请求,该请求会直接被squid重定向至代理服务的端口进行转发,web服务器会认为是squid服务器发起的请求,正常处理并转发数据,squid服务器收到后根据规则会对部分资源进行缓存,并修改目的地址转发给客户端,整个过程对客户端都是透明的,如果下次请求有缓存的数据squid服务器会直接发送给客户端,减少响应时间
配置环境
主机 |
IP地址 |
所需软件、工具 |
Squid服务器 |
内网ens33∶192.168.150.20 外网ens36∶12.0.0.20 |
squid-3.5.28 |
Web 服务器 |
192.168.15.25 |
http |
客户机 |
12.0.0.10 |
|
配置思路
(1)Squid服务器添加双网卡,对Squid配置文件中需要透明代理服务的网卡IP进行设置
(2)开启路由转发功能,设置数据重定向输入到代理端口
(3)因为是虚拟机web服务器和客户机指向Squid网卡
1. Squid服务器网卡配置
cd /etc/sysconfig/network-scripts
cp ifcfg-ens33 ifcfg-ens36
vim ifcfg-ens36
systemctl restart network
2. 修改squid服务配置文件
vim /etc/squid.conf
..........
http_access allow
all http_access deny all
--60行--修改添加需要提供代理服务的网卡IP地址,和支持透明代理选项 transparent
http_port 12.0.0.20:3128 transparent
service squid restart
3. 开启路由转发, 实现本机中不同网段的地址转发
echo 'net.ipv4.ip_forward = 1'>> /etc/sysctl.conf
sysctl-p
4. 修改防火墙规则
iptables -F #清空原有的规则
iptables -t nat -F #清空nat表规则
#用于转发http协议,将80端口重定向输入到3128端口
iptables -t nat -I PREROUTING -i ens36 -s 12.0.0.0/24 -p tcp --dport 80 -j REDIRECT --to 3128
#用于转发https协议 ,将443端口重定向输入到3128端口
iptables -t nat -I PREROUTING -i ens36 -s 12.0.0.0/24 -p tcp --dport 443 -j REDIRECT --to 3128
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
5. web服务器修改IP地址和网关信息
vim /etc/sysconfig/network-scripts/ifcfg-ens33
6. 客户机设置网关进行访问
关闭客户机的浏览器之前设置的代理服务器的功能后访问http://192.168.150.25
7. 分析Squid和web日志
#查看 Squid 访问日志的新增记录
tail -f /usr/local/squid/var/logs/access.log
#查看 Web 访问日志的新增记录,显示的是由代理服务器代替客户机在访问
tail -f /var/log/httpd/access.log
8. 抓取报文进行分析
tcpdump tcp -i ens36 -t -s 0 -c 100 -w ./target.cap
sz target.cap
五。ACL访问控制
在配置文件 squid.conf 中,ACL访问控制通过以下两个步骤来实现∶
(1)使用 acl 配置项定义需要控制的条件;
(2)通过http_access配置项对已定义的列表做"允许"或"拒绝"访问的控制。
ACL规则优先级
一个用户访问代理服务器时,Squid会顺序匹配Squid中定义的所有规则列表,一旦匹配成功,立即停止匹配
所有规则都不匹配时,Squid会使用与最后一条相反的规则
1. 定义访问控制列表格式
acl 列表名称(自定义) 列表类型 列表内容
常用的ACL列表类型
src |
源地址 |
dst |
目标地址 |
port |
目标端口 |
dstdomain |
目标域 |
time |
访问时间 |
maxconn |
最大并发连接 |
url_regex |
目标URL地址 |
Urlpath_regex |
整个目标URL路径 |
2. 定义访问控制列表格式模板
vim /etc/squid.conf
。。。。
acl localhost src 192.168.150.25/32 #源地址为192.168.150.25
acl MYLAN src 192.168.150.0/24 12.0.0.0/24 #客户机网段
acl destinationhost dst 192.168.150.100/32 #目标地址为192.168.150.100
acl MC20 maxconn 20 #最大并发连接 20
acl PORT port 21 #目标端口21
acl DMBLOCK dstdomain .qq.com #目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule:// #以rtsp://、emule://开头的目标 URL地址,-i表示忽略大小写
acl PURL urlpath regex -i \.mp3s \.mp4s \.rmvbs #以 .mp3、.mp4、.rmvb结尾的目标URL路径
acl WORKTIME time MTWHF 08:30-17:30 #时间为周一至周五8∶30~17∶30,"MTWHF"为每个星期的英文首字母
*基于之前Squid的透明代理的基础上配置
##如果列表内容较多可以加入到预先设置的表格里
例:
touch /usr/local/squid/dest.list vim /usr/local/squid/dest.list 192.168.150.25 192.168.100.0/24 vim /etc/squid.conf ...... acl host dst "/usr/local/squid/dest.list" ...... http_access deny(或allow)host service squid restart
浏览器(12.0.0.10)访问web服务器服务器http://192.168.150.25
六。Squid日志分析
1. 源码编译安装图像处理软件包
yum install -y pcre-devel gd gd-devel #安装依赖环境 mkdir /usr/local/sarg #创建配置文件存放的目录 tar zxvf sarg-2.3.7.tar.gz -C /opt/ cd /opt/sarg-2.3.7 ./configure--prefix=/usr/local/sarg \ #配置文件目录,默认是/usr/local/etc --sysconfdir=/etc/sarg \ #额外安全防护 --enable-extraprotection -------------------------------------------------------------------- ./configure --prefix=/usr/local/sarg --sysconfdir=/etc/sarg --enable-extraprotection make -j 2 && make install
2. 修改sarg工具配置文件
vim /etc/sarg/sarg.conf
--- 7行 ---取消注释
access log /usr/local/squid/var/logs/access.log #指定访问日志文件
--- 25行 ---取消注释
title "Squid User Access Reports" #网页标题
--- 120行 ---取消注释,修改
output dir /var/www/html/sarg #报告输出目录
--- 178行---取消注释
user_ip no #是否使用用户名显示
--- 184行 ---取消注释,修改
topuser_sort_field connect reverse #top排序中,指定连接次数采用降序排列,升序是normal
--- 190行 ---取消注释,修改
user_sort_field connect reverse #对于用户访问记录,连接次数按降序排序
--- 206行 ---取消注释,修改
exclude_hosts /usr/local/sarg/noreport #指定不计入排序的站点列表的文件,该文件内容不计入排序,该文件必须存在,即使为空文件否则会报错
--- 257行 ---取消注释
overwrite_report no #同名同日期的日志是否覆盖
---289行 ---取消注释,修改
mail_utility mailq.postfix #发送邮件报告命令
--- 434行 ---取消注释,修改
charset UTF-8 #指定字符集UTF-8
--- 518行 ---取消注释
weekdays 0-6 #top排行的星期周期
--- 525行 ---取消注释
hours 0-23 #top排行的时间周期
--- 633行 ---取消注释
www_document_root /var/www/html #指定网页根(根据安装的web服务)目录
3. 创建不计入站点文件,文件内添加的域名将不被显示在排序中
touch /usr/local/sarg/noreport #创建文件
ln -s /usr/local/sarg/bin/sarg /usr/local/bin/
sarg --help #查看sarg命令有哪些选项
4. 验证
yum install httpd -y
systemctl start httpd
#运行
sarg #启动一次记录
浏览器访问http://192.168.150.20/sarg,查看报告网页
5. 可以添加计划任务,执行每天生成报告
vim /usr/local/sarg/report.sh
#/bin/bash
TODAY=$ (date +%d/%m/%Y)
YESTERDAY=$ (date -d "1 day ago" +%d/%m/Y)
/usr/local/sarg/bin/sarg -l /usr/local/squid/var/logs/access.log -o /var/www/html/sarg -z -d $YESTERDAY-$TODAY &>/dev/null
find /var/www/html/squid -type d -name "20*" -a -mtime +30 | xargs rm -rf &> /dev/null
exit 0
###-l指定导入的文件,-o指定输出的路径,-z导出所有进程消息,-d指定日期范围
chmod +x /usr/local/sarg/report.sh #给予执行权限
crontab -e
0 0 * * * /usr/local/sarg/report.sh
crontab -l
systemctl status crond #确保crond服务打开才能执行计划任务
七。Squid 反向代理配置
squid服务器代理的是服务端,客户机访问squid服务器,squid服务器会查看是否缓存过请求的数据,如果有缓存会直接发送给客户机,加快了响应速度,如果没有缓存过,squid服务器会根据均衡算法转发给后端的服务器进行数据的处理,代理用户访问web服务器,避免直接对web服务器发起访问,提高了安全性,数据处理后web服务器发送给squid服务器,squid服务器返回给客户机并且会缓存再本地以方便下一次请求的使用
工作机制
●缓存网页对象,减少重复请求
●将互联网请求轮训或按权重分配到内网Web服务器
●代理用户请求,避免用户直接访问web服务器,提高安全
配置环境
主机 |
IP地址 |
所需软件、工具 |
Squid服务器 |
内网ens33∶192.168.150.20 外网ens36∶12.0.0.20 |
squid-3.5.28 |
Web 服务器1 |
192.168.150.25 |
http |
Web 服务器2 |
192.168.150.30 |
http |
客户机 |
12.0.0.10 |
|
配置思路
(1)修改squid配置文件,改变为反向代理加速模式,使用80端口监听数据请求,并添加源服务器信息,添加算法实现负载均衡
(2)注意清空之前iptables防火墙配置,关闭或修改httpd服务端口,防止端口冲突
(3)节点服务器配置web服务
(4)因为是虚拟机环境,客户端如果不在一个网段需要指定squid服务器为网关地址,访问squid服务器地址或添加端口映射直接使用域名访问,squid服务器会根据是否缓存过请求的数据再向后端服务器发起请求
1. 修改squid配置文件
vim /etc/squid.conf
...........
--- 60行 ---修改,插入
http_port 12.0.0.20:80 accel vhost vport
cache_peer 192.168.150.25 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 192.168.150.30 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.abc.com #表示对www.abc.com的请求,squid向192.168.150.25和192.168.150.30的80端口发出请求
squid -k parse #检查一下语法是否有误
字段解析
http_port 12.0.0.20:80 accel vhost vport
#squid从一个缓存变成了一个Web服务器反向代理加速模式,这个时候squid在80端口监听请求,同时和web server的请求端口(vhost vport)绑定,这个时候请求到了squid,squid是不用转发请求的,而是直接要么从缓存中拿数据要么向绑定的端口直接请求数据。
accel∶反向代理加速模式
vhost∶支持域名或主机名来表示代理节点
vport ∶支持IP和端口来表示代理节点
cache_peer 192.168.150.25 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
parent∶代表为父节点,上下关系,非平级关系
80∶代理内部web服务器的80端口
0 ∶没有使用icp(电信运营商),表示就一台squid服务器
no-query ∶不做查询操作,直接获取数据
originserver ∶指定是源服务器
round-robin ∶指定 squid通过轮询方式将请求分发到其中一台父节点 max_conn ∶指定最大连接数
weight ∶指定权重
name∶设定别名
2. 清空之前模式配置的 iptables 规则
iptables-F
iptables -t nat -F
3. 关闭httpd服务,启动squid反向代理服务
防止 httpd 服务使用的80端口号和 squid 反向代理配置的监听端口冲突
systemctl stop httpd
netstat -natp | grep squid
squid -k kill 进程号 #建议使用杀死进程的方法关闭服务确保服务关闭
systemctl start squid
netstat -natp | grep squid #查看配置端口是否生效
4. 节点服务器设置
yum install -y httpd
systemctl start httpd
节点1∶
echo "<h1>this is web001</h1>" >> /var/ww/html/index.html
节点2∶
echo "<h1>this is web002</h1>" >> /var/www/html/index.html
5. 客户机的域名映射配置
修改 C\Windows\System32\drivers\etc\hosts 文件
192.168.150.20 www.abc.com
6. 客户机的代理配置
打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器(地址∶ Squid服务器IP地址,端口∶80)
浏览器访问http://www.abc.com