今天有人说可以利用 html 页面的中 meta 标签来屏蔽搜索引擎蜘蛛的抓取或不让蜘蛛抓取网页中的其它链接,本着好奇的精神,就查了一些相关的资料,发现了一串类似 <meta name='robots' content='noindex,nofollow' /> 这样的HTML代码,可以告诉来网页爬取的蜘蛛本页内容是否可以抓取,是否可以抓取网页上的其它链接。
SEO优化之 meta 标签的解析
html meta标签的代码如下:
<meta name='robots' content='noindex,nofollow' />
解释:
name :是指的所有的搜索引擎.它的值有多个,下面列出几个。
robots:表示所有的搜索引擎
Baiduspide:百度
Googlebot:谷歌
content:表示对搜索引擎蜘蛛的行为做出指示,它有下面的几值来表示。
index:允许本页被抓取
noindex:禁止许本页被抓取
follow:允许本页的上其它链接可以被跟踪抓取
nofollow:禁止本页上的其它链接被跟踪抓取
noarchive:禁止搜索引擎对网站建立快照
SEO优化之 meta 标签的用法
根据上面 content 属性的四个值,我们可以列出以下几个组合的用法:
<meta name='robots' content='index,follow' />:可以抓取本页,也可以顺着本页继续索引别的链接
<meta name='robots' content='noindex,follow' />:禁止抓取本页,但可以抓取跟踪本页的其它链接
<meta name='robots' content='index,nofollow' />:可以抓取本页,禁止抓取和跟踪本页的其它链接
<meta name='robots' content='noindex,nofollow' />:禁止抓取本页,禁止抓取和跟踪本页的其它链接
<meta name='robots' content='noarchive' />:禁止搜索引擎建立快照
需要注意的是:
1、index 与 follow 的组合可以简化为 all
<meta name='robots' content='index,follow' />
可以写成
<meta name='robots' content='all' />
2、noindex 与 nofollow 组合可以简化为 none
<meta name='robots' content='noindex,nofollow' />
可以写成
<meta name='robots' content='none' />
3、相反的属性值是不能写在一样的,比如 index 与 noindex 不能写到一起,follow 与 nofollow 不能写到一起
下面的两个示例是错误的
<meta name='robots' content='index,onindex' />
<meta name='robots' content='follow,onfollow' />
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端