机器人的meta标记[翻译]
原文地址:http://javascriptkit.com/howto/robots2.shtml
如果你的网站供应商禁止你上传robots.txt文件到根目录,或者你仅仅是希望部分定制搜索爬虫对于你网站上的一些页面的动作,有一个可以代替robot.txt的方法,那就是使用robots的meta标签。
创建你的机器人meta标志
其实,机器人的meta标志和其他的meta标志没有什么两样,一定是添加在你的页的head部分的。
如果你的网站供应商禁止你上传robots.txt文件到根目录,或者你仅仅是希望部分定制搜索爬虫对于你网站上的一些页面的动作,有一个可以代替robot.txt的方法,那就是使用robots的meta标签。
创建你的机器人meta标志
其实,机器人的meta标志和其他的meta标志没有什么两样,一定是添加在你的页的head部分的。
<meta name="robots" content="noindex,nofollow" />
这里有一个contents属性可以使用值的列表
值 | 描述 |
---|---|
(no)index | 是否允许爬虫索引该页面,允许的值: "noindex"或"index" |
(no)follow | 是否允许爬虫跟踪页面中的链接并且挖掘它们,允许的值"nofollow"或"follow." |
这里有一些例子
1> 以下代码不允许对当前页索引,也不允许爬虫对超链接的页面进行跟踪
<meta name="robots" content="noindex,nofollow" />
2> 不允许页面索引,但允许爬虫对超链接的页面进行跟踪
<meta name="robots" content="noindex,follow" />
3> 允许页面索引,但不允许爬虫对超链接的页面进行跟踪
<meta name="robots" content="index,nofollow" />
4> 最后,有一个简单的方式来声明1>中的东西<meta name="robots" content="none">
版权声明:本文由作者Tony Qu原创, 未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则视为侵权。