【nginx】关于gzip压缩
有这么一段配置文件
gzip on # 默认值: gzip off # 开启或者关闭gzip模块 gzip_static off; # nginx对于静态文件的处理模块 # 该模块可以读取预先压缩的gz文件,这样可以减少每次请求进行gzip压缩的CPU资源消耗。该模块启用后,nginx首先检查是否存在请求静态文件的gz结尾的文件,如果有则直接返回该gz文件内容。为了要兼容不支持gzip的浏览器,启用gzip_static模块就必须同时保留原始静态文件和gz文件。这样的话,在有大量静态文件的情况下,将会大大增加磁盘空间。我们可以利用nginx的反向代理功能实现只保留gz文件。 # 可以google"nginx gzip_static"了解更多 gzip_comp_level 4; # 默认值:1(建议选择为4) # gzip压缩比/压缩级别,压缩级别 1-9,级别越高压缩率越大,当然压缩时间也就越长(传输快但比较消耗cpu)。 gzip_buffers 4 16k; # 默认值: gzip_buffers 4 4k/8k # 设置系统获取几个单位的缓存用于存储gzip的压缩结果数据流。 例如 4 4k 代表以4k为单位,按照原始数据大小以4k为单位的4倍申请内存。 4 8k 代表以8k为单位,按照原始数据大小以8k为单位的4倍申请内存。 # 如果没有设置,默认值是申请跟原始数据相同大小的内存空间去存储gzip压缩结果。 gzip_types text/plain application/x-javascript text/css application/xml text/javascript application/x-httpd-php image/jpeg image/gif image/png; #gzip_types mime-type [mime-type ...]; # 默认值: gzip_types text/html (默认不对js/css文件进行压缩) # 压缩类型,匹配MIME类型进行压缩 # 不能用通配符 text/* # (无论是否指定)text/html默认已经压缩 # 设置哪压缩种文本文件可参考 conf/mime.types gzip_min_length 1k; # 默认值: 0 ,不管页面多大都压缩 # 设置允许压缩的页面最小字节数,页面字节数从header头中的Content-Length中进行获取。 # 建议设置成大于1k的字节数,小于1k可能会越压越大。 即: gzip_min_length 1024 gzip_http_version 1.0 # 默认值: gzip_http_version 1.1(就是说对HTTP/1.1协议的请求才会进行gzip压缩) # 识别http的协议版本。由于早期的一些浏览器或者http客户端,可能不支持gzip自解压,用户就会看到乱码,所以做一些判断还是有必要的。 # 注:99.99%的浏览器基本上都支持gzip解压了,所以可以不用设这个值,保持系统默认即可。 # 假设我们使用的是默认值1.1,如果我们使用了proxy_pass进行反向代理,那么nginx和后端的upstream server之间是用HTTP/1.0协议通信的,如果我们使用nginx通过反向代理做Cache Server,而且前端的nginx没有开启gzip,同时,我们后端的nginx上没有设置gzip_http_version为1.0,那么Cache的url将不会进行gzip压缩 gzip_proxied any #gzip_proxied [off|expired|no-cache|no-store|private|no_last_modified|no_etag|auth|any] ...; # 默认值:off # Nginx作为反向代理的时候启用,开启或者关闭后端服务器返回的结果,匹配的前提是后端服务器必须要返回包含"Via"的 header头。 # off - 关闭所有的代理结果数据的压缩 # expired - 启用压缩,如果header头中包含 "Expires" 头信息 # no-cache - 启用压缩,如果header头中包含 "Cache-Control:no-cache" 头信息 # no-store - 启用压缩,如果header头中包含 "Cache-Control:no-store" 头信息 # private - 启用压缩,如果header头中包含 "Cache-Control:private" 头信息 # no_last_modified - 启用压缩,如果header头中不包含 "Last-Modified" 头信息 # no_etag - 启用压缩 ,如果header头中不包含 "ETag" 头信息 # auth - 启用压缩 , 如果header头中包含 "Authorization" 头信息 # any - 无条件启用压缩 gzip_vary on; # 和http头有关系,加个vary头,给代理服务器用的,有的浏览器支持压缩,有的不支持,所以避免浪费不支持的也压缩,所以根据客户端的HTTP头来判断,是否需要压缩 gzip_disable "MSIE [1-6]."; # 禁用IE6的gzip压缩,又是因为杯具的IE6。当然,IE6目前依然广泛的存在,所以这里你也可以设置为“MSIE [1-5].” # IE6的某些版本对gzip的压缩支持很不好,会造成页面的假死,为了确保其它的IE6版本不出问题,所以建议加上gzip_disable的设置
1、gzip_comp_level
text/html
- phpinfo():
0 55.38 KiB (100.00% of original size) 1 11.22 KiB ( 20.26% of original size) 2 10.89 KiB ( 19.66% of original size) 3 10.60 KiB ( 19.14% of original size) 4 10.17 KiB ( 18.36% of original size) 5 9.79 KiB ( 17.68% of original size) 6 9.62 KiB ( 17.37% of original size) 7 9.50 KiB ( 17.15% of original size) 8 9.45 KiB ( 17.06% of original size) 9 9.44 KiB ( 17.05% of original size)
application/x-javascript
- jQuery 1.8.3 (Uncompressed):
0 261.46 KiB (100.00% of original size) 1 95.01 KiB ( 36.34% of original size) 2 90.60 KiB ( 34.65% of original size) 3 87.16 KiB ( 33.36% of original size) 4 81.89 KiB ( 31.32% of original size) 5 79.33 KiB ( 30.34% of original size) 6 78.04 KiB ( 29.85% of original size) 7 77.85 KiB ( 29.78% of original size) 8 77.74 KiB ( 29.73% of original size) 9 77.75 KiB ( 29.74% of original size)
这里没有考虑CPU使用率,理想的压缩级别在4-6之间
2、gzip_static
- 该模块可以读取预先压缩的gz文件,这样可以减少每次请求进行gzip压缩的CPU资源消耗。该模块启用后,nginx首先检查是否存在请求静态文件的gz结尾的文件,如果有则直接返回该gz文件内容。为了要兼容不支持gzip的浏览器,启用gzip_static模块就必须同时保留原始静态文件和gz文件。这样的话,在有大量静态文件的情况下,将会大大增加磁盘空间。我们可以利用nginx的反向代理功能实现只保留gz文件。
- # 可以google"nginx gzip_static"了解更多
- 使用PHP预先压缩如下
function gzip_static($path) { if ((extension_loaded('zlib') === true) && (is_file($path) === true)) { $levels = array(); $content = file_get_contents($path); foreach (range(1, 9) as $level) { $levels[$level] = strlen(gzencode($content, $level)); } if ((count($levels = array_filter($levels)) > 0) && (min($levels) < strlen($content))) { if (file_put_contents($path . '.gz', gzencode($content, array_search(min($levels), $levels)), LOCK_EX) !== false) { return touch($path . '.gz', filemtime($path), fileatime($path)); } } } return false; }
3、开启缓存
location ~* \.(ico|jpe?g|gif|png|bmp|swf|flv)(\?[0-9]+)?$ { valid_referers none blocked www.xx.com xx.com expires 30d; log_not_found off; access_log off; } location ~* \.(js|css)$ { expires 7d; log_not_found off; access_log off; } location = /(favicon.ico|roboots.txt) { access_log off; log_not_found off; } location ~* \.(htacess|svn|tar.gz|tar|zip|sql) { return 404; } location ~* \.(eot|ttf|otf|woff|svg)$ { access_log off; expires max; }
4、gzip_vary
要了解 Vary 的作用,先得了解 HTTP 的内容协商机制。有时候,同一个 URL 可以提供多份不同的文档,这就要求服务端和客户端之间有一个选择最合适版本的机制,这就是内容协商
vary机制是http1.1 协议的新特性,使得server端可以根据用户请求返回给用户不同的内容,现在互联网中应用vary最广的一点就是对压缩的支持,例如当用户请求带着header “Accept-Encoding: gzip,deflate”,表明用户期望从server端拿到压缩的内容,这样server端会给用户一个包含压缩内容的文件,并带着vary头“vary: Accept-Encoding”头,和“Content-Encoding:gzip ”头,如果用户请求非压缩的内容,源站也就可以给用户非压缩的内容。
这个出问题很多时候在于缓存服务的时候,比如squid
这个启用之后,response header 中会加上 Vary: Accept-Encoding
gzip_vary on;
用 curl 验证
[root@AY ~]# curl -I -v http://common.cnblogs.com/script/jquery.js * About to connect() to common.cnblogs.com port 80 (#0) * Trying 42.121.254.191... connected * Connected to common.cnblogs.com (42.121.254.191) port 80 (#0) > HEAD /script/jquery.js HTTP/1.1 > User-Agent: curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.14.0.0 zlib/1.2.3 libidn/1.18 libssh2/1.4.2 > Host: common.cnblogs.com > Accept: */* > < HTTP/1.1 200 OK HTTP/1.1 200 OK < Date: Sun, 22 Nov 2015 11:21:55 GMT Date: Sun, 22 Nov 2015 11:21:55 GMT < Content-Type: application/javascript Content-Type: application/javascript < Content-Length: 94020 Content-Length: 94020 < Connection: keep-alive Connection: keep-alive < Vary: Accept-Encoding Vary: Accept-Encoding < Cache-Control: public,max-age=25920000 Cache-Control: public,max-age=25920000 < Last-Modified: Fri, 15 Feb 2013 03:06:57 GMT Last-Modified: Fri, 15 Feb 2013 03:06:57 GMT < Accept-Ranges: bytes Accept-Ranges: bytes < ETag: "7468b58329bce1:0" ETag: "7468b58329bce1:0" < * Connection #0 to host common.cnblogs.com left intact * Closing connection #0
参考
http://nginx.org/en/docs/http/ngx_http_gzip_static_module.html
http://serverfault.com/questions/253074/what-is-the-best-nginx-compression-gzip-level
http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html
http://weblogs.asp.net/owscott/iis-7-compression-good-bad-how-much
- 作者:踏雪无痕
- 出处:http://www.cnblogs.com/chenpingzhao/
- 本文版权归作者和博客园共有,如需转载,请联系 pingzhao1990#163.com