最新实战讲解.htaccess文件rewrite规则
.htaccess文件大家都不陌生吧。不认识的自己去搜一下……顺便告诉你,这是个好东西,值得一学。
似乎网上关于.htaccess编写方法的教程很有限,相信博主们也没有几个是自己写的吧?
我在这里就搜了几个常用规则,总结一下rewrite规则的用法。当然这只是.htaccess功能的一小部分,但是相当实用。
如果熟练掌握rewrite规则的编写,能够加强对网站URL的控制,对用户体验、SEO都十分有利。
一、防盗链功能
1 |
RewriteEngine On |
2 |
RewriteCond %{HTTP_REFERER} !^http://(.+.)?mysite.com/ [NC] |
3 |
RewriteCond %{HTTP_REFERER} !^$ |
4 |
RewriteRule .*.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L] |
逐行讲解一下:
1.打开Rewrite功能。有可能服务器设置里已经是全局下打开了,但是多写也没事。
2.RewriteCond指令,定义生效条件,用于寻找匹配条件的地址。后面内容用正则表达式匹配。代表含义是发送的请求不由mysite.com而来,那就是盗链啦。末尾的[NC]代表忽略大小写。
3.发送请求的主机前缀不为空。
4.RewriteRule指令,定义重写规则,把匹配的地址按此规则重写。本例中把这些后缀为这些图片格式的,都替换到某一个图片下。[L]表示这是最后一段规则。
只这四行就实现了防盗链是不是很神奇(- -||),编写起来是不是又觉得复杂。
这里总结了几个常用参数(不是全部):
RewriteCond下:
[NC] 不分字母大小写
[OR] 用于连接下一条规则
RewriteRule下:
[R] 强制重定向,[R=code] code默认为302
[F] 禁用URL,返回HTTP 403 错误
[L] 这是最后一条规则,之后内容无用
还有一篇关于正则表达式的教程(很详细):http://www.unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm
二、网址规范化
1 |
Options +FollowSymLinks |
2 |
rewriteEngine on |
3 |
rewriteCond %{http_host} ^yourdomain.com [NC] |
4 |
rewriteRule ^(.*)$ http://www.yourdomain.com/$1 [R=301,L] |
这个是把所有二级域名都重定向到www.yourdomain.com的例子,现在看来是不是很简单了?
需要注意的是,这里的Options +FollowSymLinks不是必须的,但在某些服务器如果不设置FollowSymLinks,可能引起500错误。
再来看一个好玩的重定向
1 |
RewriteEngine On |
2 |
RewriteBase / |
3 |
RewriteCond %{HTTP_USER_AGENT} (Googlebot) |
4 |
RewriteRule ^ http://abc.com/ [R=301,L] |
1.打开Rewrite功能。
2.RewriteBase指令,设置目录级重写的基准URL。可以理解成把该目录(这个.htaccess所在目录)假定为基准的URL前缀。本例中这样的写法无用。
3.RewriteCond指令。匹配所有USER_AGENT为Googlebot的发送请求。
4.RewriteRule指令。本例中把这些请求都重定向到了abc.com。
在本例中,这个配置应该是黑客所为,把google蜘蛛指向某个网站,等于伪造PR。
三、临时错误页面
当你的网站在升级、修改的时候,你最好让访客转到指定的页面,而不是没做完的页面或者是错误页。
这时我们做一个302转跳就好。
1 |
RewriteEngine on |
2 |
RewriteCond %{REQUEST_URI} !/maintenance.html$ |
3 |
RewriteCond %{REMOTE_ADDR} !^123.123.123.123 |
4 |
RewriteRule $ /error.html [R=302,L] |
1.继续打开Rewrite功能。- -|
2.REQUEST_URI,请求的URL值。这里指所有访问maintenance.html页面的请求。
3.REMOTE_ADDR,向服务器发送请求的IP地址。本例中此处应设为你自己的IP,这样就只有你能访问。
4.RewriteRule指令。本例中把这些请求都重定向到了error.html 。
在本例,我们总结几个常用的正则表达式和特殊符号。
(.*) 用于匹配某一区域内所有内容。如 abc/def/ghi 可用 (.*)/(.*)/(.*) 匹配。
([a-zA-Z_]+) 匹配英文单词,允许用-和_连接。
([0-9]+) 匹配多位数字,通常用于匹配ID。
([0-9]) 只匹配一位的数字。
^ 表示正则的开始
$ 表示正则的结束
四、重定向RSS地址到Feedburner
除了可以更改模板里的RSS地址外,.htaccess也能实现RSS地址的更改,并更加方便。
1 |
RewriteEngine on |
2 |
RewriteCond %{HTTP_USER_AGENT} !FeedBurner [NC] |
3 |
RewriteCond %{HTTP_USER_AGENT} !FeedValidator [NC] |
4 |
RewriteRule ^feed/?([_0-9a-z-]+)?/?$ http://feed.onexin.net/yourname [R=302,NC,L] |
有了上面的总结,本例其实就很简单了吧。
唯一要注意的是这样操作要确保填写正确的HTTP_USER_AGENT。其实你不常换模板的话。。可能还是直接改模板更省事。
在最后,为懒虫们推荐几个好东东:
在线.htaccess生成器:http://tool.onexin.net/htaccess/
mod_rewrite模块中文参考手册:http://help.onexin.net/apache/mod/mod_rewrite.html
P.S. 其实我以为rewrite也只是APACHE一个模块而已,做到边查边写足矣,实在不行直接去搜一个规则也未尝不可。没有必要费太大力气去学。不过其中的正则表达式还是非常实用的,值得深入学习。