《搜索引擎优化 SEO 知识完全手册》完整版2

第三部分:对搜索引擎友好的网页设计制作
一般的网页设计都由网页设计师完成。设计师设计网站往往仅从美观、创意和易用的角度考虑,这对于一个期望获得搜索引擎排名优秀的商业网站来说,已经远远不够了,网站策划人员至少应该为设计师递交一份需求备忘录,提醒在设计中需要配合和注意的环节。
                      目录结构和 URL
URL 是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于 URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
目录层次:
对于一个小型网站来说,一般只有一层子目录,如下:
http://www.yoursite.com/dir1/page.htm
www.yoursite.com 是域名,dir1 是一级目录名,page 是文件名。对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Flat)。
而对规模大一些的网站,往往需要二到三层子目录。象这样:
http://www.yoursite.com/dir1/dir2/dir3/page.htm
搜索引擎还是会去抓取二到三层子目录下的文件,但最好不要超过 3 层,如果超过 4 层,象以下这个页面,搜索引擎就很难去搜索它了:
http://www.yoursite.com/dir1/dir2/dir3/dir4/page.htm
当然,以下情况下,即使深入第四层甚至更深层次的页面,也同样能被搜索到:
1、如果该页提供了重要内容,有大量来自其它网站的外部链接(Inbound Links);
2、如果在首页上增加一个该页的链接,可以通过首页直接到达,搜索 Spider 还是可以轻易地找到它;
3、如果有其它网站在顶级页面上链接了该页,其效果就好似你在自己的首页上做了该链接。此外,图形、脚本、CGI-BIN 和 CSS 样式表则各自建立专门的目录收入其中,一般不放在根目录下。
目录和文件命名:
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。我们常用连字符“-”和下划线“_”进行分隔,URL 中还经常出现空格码“%20”。因此,如果以“中国制造”作文件名,就可能出现以下三种分隔形式:
  made-in-china.htm
  made_in_china.htm
  made%20in%20china.htm
但事实上,至少在目前 Google 并不认同“_”为分隔符。对 Google 来说, made-in-china
和 made%20in%20china 都等于 made in china,但 made_in_china 就被读成了 madeinchina,连在一起之后,关键词就失去了意义。因此,目录和文件名称如果有关键词组,要用连字符“-”而不是下划线“_”进行分隔。
URL 应该越短越好。有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于 URL 中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
绝对 URL 和相对 URL:
绝 对 URL : 即 网 页 路 径 使 用 包 含 顶 级 域 名 在 内 的 完 整 的 URL 。 如 :www.yoursite.com/page1/index.html 是一个绝对路径,其中/page1/index.html 则为相对路径,由浏览器自动在该链接前加上 www.yoursite.com。总体上,Google 在排名时并不在意 URL 使用的是相对路径还是绝对路径。
动态 URL:
目前很多网站都有数据库驱动生成的 URL,即动态 URL,往往表现为在 URL 中出现“?”、“=”、“%”,以及“&”、“$”等字符。动态 URL 极不利于搜索引擎抓取网页,严重影响网站排名,
通常是通过技术解决方案将动态 URL 转化成静态的 URL 形式,如:
http://www.domain.com/messages.php?id=2&type=5
转化为 http://www.domain.com/messages/2/5/
下文将会专门提到动态 URL 的解决方案。
                            导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、 主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、 “面包屑型(Breadcrumbs)”路径
所谓“面包屑”是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失“方向”,并方便回到上级页面和起点。路径中的每个栏目最好添加链接。如下:
时代营销:首页 > 网络营销动态 > 特别报道
即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的 LOGO作链接。
3、首页突出重要内容
    除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现,以突出重点。搜索引擎会对这种一站内多次出现的链接给予充分重视,对网页级别
(PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重要因素,因为每个子页都对首页进行了链接。
4、使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在 SEO 中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google 明确提出“如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页”。
工具推荐:
Xenu:http://home.snafu.de/tilman/xenulink.html 生成网站地图
                          框架结构

框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO 部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在 URL 中体现出来,即使进入深层子页面,浏览器显示出来的 URL 仍然是主页的 URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用“Noframes”标签进行优化,把 Noframe 标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向 frame 页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用 iframe 即内联框架(Inner Frame)技术来避免 Frame 带来的不便。所谓 iframe 也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe 可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为: <iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>”
对搜索引擎来说,iframe 中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将 iframe 内容看成单独的一个页面内容,与被内嵌的页面无关。
                          图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过 20 秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt 属性:
每个图像<IMG>标签中都有 ALT 属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的 ALT 属性中都有文字描述,并带上该页关键字在其中。
如:www.marketingman.net/wm37.htm 的书籍广告图片代码为:
<img src="images/webmarketing2_cover_200.jpg" width="200" height="259" alt="《网
络营销基础与实践》第 2 版(冯英健著,2004)" border="0">
文本说明:
除了 ALT 属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
1、在图片上方或下方加上包含关键词的描述文本;
2、在代码中增加一个包含关键词段的 heading 标题标签,然后在图片下方增加文字描述。
3、在图片下方或旁边增加如“更多某某”链接,包含关键词。
4、创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
总体上,网页应尽量减少装饰性图片以及大图片。而 Alt 属性中的文字对搜索引擎来说,其重要性比正文内容的文字要低。
Gif 和 JPGE 图像优化:
Alt 属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有 GIF 和 JPGE 两种形式。一般来讲,GIF 适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少 GIF 颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop 的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
工具推荐(英文):www.xat.com/internet_technology/download.html (图片优化工具)
FLASH 优化:
由于 FLASH 优美的视觉效果和广阔的创意空间,FLASH 技术在网页设计和网络广告中的应用非常广泛,很多网站首页甚至全部用 FLASH 设计。但 FLASH 网页有一个非常致命的问题,即大部分搜索引擎无法识别 FLASH 中的信息。Google 也只能检索到部分 Flash 文件中的内嵌链接。以下列举一个制造机电设备的企业网站首页的代码,用 FLASH 制作,请注意是否可以看见有意义的文本:
<html>
<head>
<title>Welcome</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style type="text/css">
<!-- body {
  margin-left: 0px;
  margin-top: 0px;
  margin-right: 0px;
  margin-bottom: 0px;
}
-->
</style>
<link rel="stylesheet" href="style.txt" type="text/css">
</head>
<body bgcolor="#FFFFFF" text="#000000">
<table border="0" width="100%" height="100%" cellspacing="0" cellpadding="0">
<tr>
  <td width="100%" background="images/bg.jpg"><div align="center">
    <center>
    <table width="777" border="0" align="center" cellpadding="0" cellspacing="0">
      <tr>
        <td><object classid="clsid27CDB6E-AE6D-11cf-96B8-444553540000"
codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,29
,0" width="777" height="455">
        <param name="movie" value="index.swf">
        <param name="quality" value="high">
        <embed src="index.swf" quality="high"
pluginspage="http://www.macromedia.com/go/getflashplayer"
type="application/x-shockwave-flash" width="777" height="455"></embed>
        </object></td>
      </tr>
    </table>
    <br>
   <span class="style2">
本 页 使 用 FLASH 技 术 , 如 果 无 法 正 常 浏 览 请 下 载 并 <a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">安装插件 </a>或<a href="asp-bin/big5/?page=1">直接进入 </a><br> if you are not able to view the animated a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">pleass           install
plug-in </a> first <br><!--网站计数器开始-->
<scrīpt language="Javascrīpt" src="counter/count.asp"></scrīpt>
<!--网站计数器结束-->
    </span>
    </center>
    </div>   </td>
</tr>
</table>
</body>
</html>
同时再采用模拟蜘蛛程序的工具,测试到搜索引擎对该页抓取结果如下:
Spidered Text (蜘蛛可识别的文本):
Welcome 本页使用 FLASH 技术,如果无法正常浏览请下载并 安装插件 或 直接进入 if you
are not able to view the animated pleass install plug-in first
Spidered Links(蜘蛛可识别的链接):
http://www.macromedia.com/shockw ... gerpages/flash.html
asp-bin/big5/?page=1 (下载 FLASH 插件的链接地址)
http://www.macromedia.com/shockw ... gerpages/flash.html
因此可以得出结论是:
蜘蛛程序没有在这个企业网站首页获得任何有意义的文本内容,也没有获得该 Flash 首页中进入“中文版”“英文版”关键性内容的链接。
FLASH 优化可以从以下三个方面来考虑:
1、做一个辅助 HTML 版本:
保留原有 FLASH 版本的同时,还可以设计一个 HTML 格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过 HTML 版本的网页来发现网站。
2、将 Flash 内嵌 HTML 文件:
还可以通过改变网页结构进行弥补,即不要将整个网页都设计成 Flash 动画,而是将 Flash内容嵌入到 HTML 文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从 HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。即使首页全部动用了 FLASH,也应该将进入内页的关键性按钮/链接置于 FLASH 文件之外,以独立纯文本链接的方式呈现。上文案例将“中文版”链接置于 FLASH 文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、 付费登录搜索引擎:
如果 FLASH 网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。
总体上,商业网站应尽量少用 FLASH,站点间进行广告交换时也要避免采用 FLASH 广告为上策。
                          表格使用

表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
                          网页减肥

代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代码进行清减(俗称“网页减肥”),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在 15K 左右,最好不要超过 50K。网页减肥重点涉及以下几个要点:
CSS 样式
网页制作应通过 CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如< h1 >< /h1 >、< font size=×× color=×× >< /font >充斥页面。通过 css 可以控制任何 HTML 标签的风格。例如<td>,<p>,<body>,<table>,<tr>,<th>等。只要在HTML的<head>区内的<style type="text/css">和</style>之间指定对应标签的风格如字体,颜色,大小即可,例如:
<style type="text/css">
<!--
h2 { font-family: "宋体"; font-size: 12pt; color: #333366; background-color:
#FFCCCC; font-weight: bold}
h1 { font-family: "Arial"; font-size: 12pt; color: #993300}
-->
</style>
仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行格式定义,从而减少大量重复性标签。注意把所有 css 文件单独存放在命名为 css 的外部文件中。通过设置 CSS 样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。
Javascrīpt:
正常情况下,网页尽量以<HTML>作为代码的开始端。但采用 Javascrīpt 技术的网页往往在页面一开始就堆积大量 JAVA 代码,以至 META 及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
1、 将脚本移至页面底部
大部分的 JAVA 代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。
2、 将 JAVA 脚本置入一个.js 扩展名的文件。
包含你的 Javascrīpt 的.js 文件通常在网站访问者的浏览器中被缓存下来,使得下次访问速度加快,也使得网站修改和维护起来更加方便。例:一段 JAVA 代码正常情况下显示如下:
<scrīpt language=Javascrīpt>
<!--
此处是你的代码,将它们拷贝到一个.js 文件
//-->
</scrīpt>
忽略开始及结束标签,将中间的代码单独保存为扩展名为.js 的文件,如文件名为
“mycode.js”的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上文列举的完整的 Javascrīpt 置换为简单的一行:
<scrīpt language=Javascrīpt src=mycode.js></scrīpt>
这样,一个“mycode.js”文件就将大段冗长复杂的 JAVA 代码置换了。
工具推荐:
网页减肥工具:http://202.99.237.33/softdown/softdoc/net_opt.htm 去除网页中多余
代码,减小网页。
第四部分:SEO 指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO 思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。
                    Title 和 Meta 标签
以.html 或.htm 为扩展名的 HTML 文档称为静态网页。Meta 称为元标志,用于网页的<head>与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta 值来给网页分类,是籍此判断网页内容的基础。其中最重要的是 descrīption(网站描述)和 keywords(网站关键词)。另外一个基本的属性是 Title 标签,提示搜索引擎关于本页的主题。Meta 和 Title 的形式在 html 语言中体现为:
<head>
<title>title 标题</title>
<meta name="keywords" content="网页描述">
<meta name="descrīption" content="关键词">
......
</head>


尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。清晰准确的 Meta 文字与正文内容的关键词相呼应,是排名加分的重要条件之一。
标题(Title):
网页优化可以说是从 Title 开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的 Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的 Title。因此,Title 可谓一个页面的核心。对 Title 的书写要注意以下问题:
1、title 简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,不要超过 3 个词组。企业网站的 title 通常以公司名+关键词为内容
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将 title 组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式
title
关键词(Keywords):
Keywords 提示搜索引擎:本网站内容围绕这些词汇展开。因此 keywords 书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta 中的关键词书写技巧见前文的“关键词策略”。
描述(Descrīption):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Descrīption 一般被认为重要性在 title 和 keywords 之后。描述的书写要注意以下问题:
1、 描述中出现关键词,与正文内容相关
2、 同样遵循简短原则,字符数含空格在内不要超过 200 个字符
3、 补充在 title 和 keywords 中未能充分表述的说明
其它 Meta 标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个 Robots Meta 标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow">
其中:all:文件将被检索,且页面上的链接可以被查询; none:文件将不被检索,且页面上的链接不可以被查询;index:文件将被检索;follow:页面上的链接可以被查询;noindex:文件将不被检索,但页面上的链接可以被查询;nofollow:文件将不被检索,页面上的链接可以被查询。但并不是所有的搜索引擎都支持 meta 中的 robots 标签,但是所有搜索引擎都支持一个功能 ,更强的 robots.txt 的文本文件来达到上述功能(关于 robots.txt 文件应用的介绍,E 书专家平文胜曾专门撰文详细解说“robots.txt 和 Robots META 标签”)。其它常用 meta 标签还有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的
……
首页、重要的内页的 title 和 meta 标签最好分别书写,针对栏目主题体现不同的内容。
                        动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统(CMS)完成。一般采用 ASP,PHP,Cold Fusion,CGI 等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm 或.cgi,而不是静态网页的.html 或者.htm。其 URL 中通常出现“?”、“=”、“%”,以及“&”、“$”等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。但大多数搜索引擎的蜘蛛程序都无法解读符号“?”后的字符。这就意味着动态网页很难被搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转化成静态网页形式,使 URL 中不再包含“?”“=”等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持“动静结合,以静制动”的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者 Karen 编译的部分内容:
1、CGI/ Perl
如果你在网站中使用的是 CGI 或者 Perl,可用一个脚本拾取环境变量前的所有字符,再将URL 中剩余的字符赋值给一个变量。这样,你就可以在 URL 中使用该变量了。
不过,对于那些内置了部分 SSI(Server-Side Include:服务器端嵌入)内容的网页,主要
的搜索引擎都能够提供索引支持。那些以.shtml 为后缀名的网页也被解析成 SSI 文件,相当于通常的.html 文件。但如果这些网页在其 URL 中使用的是 cgi-bin 路径,则仍有可能不被搜索引擎索引。
2、ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器中。使用 ASP 开发的网页,一般后缀名为.asp。只要避免在 URL 中使用符号“?”,大多数搜索引擎都能够支持用 ASP 开发的动态网页。
3、Cold Fusion
如果你使用的是 Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够将一个环境变量中的符号“?”用符号“/”代替,并将替换后的数值传给 URL。这样一来,最后到达浏览器端的就是一个静态的 URL 页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇“?”,因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。
4、Apache 服务器:
Apache 是最流行的 HTTP 服务器软件之一。它有一个叫做 mod_rewrite 的重写模块,即 URL 重写转向功能。该模块能够使你将包含环境变量的 URL 转换为能够为搜索引擎支持的 URL 类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。
建立静态入口:
在“静动结合,以静制动”的原则指导下,还可以通过对网站做一些修改,尽可能增加动态网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从 SEO 的角度看是值得的。也可以考虑为你的重要动态内容创建静态的镜象网站。
付费登录搜索引擎:
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT 和百度等开始尝试抓取动态网站页面(甚至包括 URL 带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的 URL 地址,请注意:
文件 URL 中不要有 Session Id,同时不要用 ID 作为参数名称(特别是对于 GOOGLE);
如 :《 网 络 营 销 基 础 与 实 践 》 一 书 , 在 当 当 网 的 介 绍 页 面 URL 地 址 是 :
http://www.dangdang.com/product_ ... p?product_id=493698,该页就无法被读取。参数越少越好,尽量不要超过 2 个;尽量不要在 URL 中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
  百度常见站长问题:http://www.baidu.com/search/guide.html#2
第五部分:搜索引擎优化的重点:链接策略
链接是网站的灵魂。用户通过超级链接获得丰富的网站内容,搜索引擎蜘蛛也是沿着一个网站的页面链接层层跟踪深入,完成对该网站的信息抓取。对搜索引擎尤其是 Google 来说,决定一个网站排名的关键,是外部有多少高质量的链接指向这个网站。这就是外部链接或反向链接,也称导入链接(Inbound links 或 backlinks)。而从网站引向其它网站的导出链接以及网站内部页面间的彼此链接也对排名带来或多或少的影响。
                      搜索引擎分类目录
搜索引擎目录(Directory)即搜索引擎的人工分类目录。今天,登录分类目录是网站建成后非常基础、重要的工作,尤其登录几大主要分类目录,其重要性不在于访问者是否通过目录链接找到你的网站,而主要在于通过这些目录你的网站获得了重要的、高质量的外部链接,这对于你的网站提高排名具有举足轻重的作用。目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录 ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪。可以分为免费登录和付费登录两种情况。无论是免费还是付费,都须通过手工输入登录。
免费登录:
最著名最重要的登录是全球最大的开放式目录库 Open Directory Project:www.dmoz.org
ODP 的宗旨是:建立网上最全面最权威的目录,以及建立一个被公众认为高质量的资源库。
在这一宗旨下,全球志愿编辑员选择高质量内容的网站核准进入分类目录。
由于 Google 等重要搜索引擎都采用 ODP 的数据库,是 Google 每月一次深度索引的基础,因此向 ODP 提交网页成为每个网站完成后的首要工作。登录 ODP 目录是免费的,但要接受较为严格的人工审核和较长时间的等待,并且最后可能网站登录不成功,还要经历反复提交的过程。
由于 DMOZ 目录在网站排名中举足轻重的作用,使得越来越多良莠不齐的的网站向 DMOZ 提交或违规提交,而志愿加入的人工编辑队伍中出现以权谋私的现象和素质不高的情况,诸多因素使得现在登陆 DMOZ 非常困难,没有一个网站敢保证被 DMOZ 收录。因此,要确保登录成功,唯一的办法是小心谨慎地完全遵守 DMOZ 登录条款。以下是必须遵守的提交注意事项:
1、确保网站内容是原创而非转载、镜象或复制
如果你的网站内容只是一些会员制产品/服务信息及链接,或是大量拷贝其它站点内容,那么你的网站极有可能被 DMOZ 拒绝。即使对已经收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ 也会将其从目录中剔除。所以务必在网站中加入产品或服务的原创介绍信息。
2、不要采用虚假、作弊和夸张的手段
被搜索机器人反感的做法,同样被目录编辑拒之门外。下文将有专门章节讲到什么是搜索引擎作弊行为。网站说明中任何虚假、夸张的文字都会遭到拒绝。对违法性内容,也是不会收录的。
3、确保网站外观的良好性
如果网站内容出现大量拼写错误、死链接或“正在建设中”的字样,或者下载缓慢,都会阻碍编辑对你的网站的收录。此外,对于来自免费主机的网站,被 DMOZ 收录的机会很少。
4、确保网站中包含具体联系信息
一个 DMOZ 编辑称,如果他在网站中找不到实际联系地址或电话号码,他就会认为这个网站不具备可信度。因此,如果你的网站中只有一个 Email 地址作为联系信息,是极不利于收录成功的。
5、确保网站提交到正确的目录
选择合适的分类目录及子目录是网站提交的核心。很多网站登录失败只是由于提交选择的目录不正确所致。所以在提交网站之前,必须先浏览整个目录,最好也了解一下竞争对手的网站都放在哪个目录下。确认之后,才在该目录页面右上角点击“提交网页”。
6、记下提交日期、目录名和编辑邮箱
向 ODP 提交完你的网站后,记下提交的日期及目录。如果你提交的那个目录下有编辑员信息,最好把编辑的名字和邮箱也记下来。这些信息,对于你需要询问提交网站的处理状态或再次提交时,非常有用。
7、不要多次重复提交网站
因为编辑是根据网站的提交日期顺序进行处理的,一个目录下往往有很多网站在队列中等候审批。从提交成功到最后收录,最快也要 2 周时间,最晚的甚至要等到半年以后。因此,你需要耐心等待结果。如果网站非常庞大,且拥有很多不同内容的分支时,你可以尝试将不同内容的网页分别向 DMOZ 下的相应目录进行提交。
一旦 DMOZ 收录了你的网站,那很快就可以被 Google,Lycos,Netscape,AOL, HotBot,DirectHit 等一些大型搜索引擎和门户网站收录。
其它的重要免费目录包括 Yahoo 目录。Yahoo 是最早开始做分类目录的网站,直到今天登录Yahoo 目录也是网站推广的重要环节。Google 把来自 Yahoo 目录的链接作为网站排名的重要分值。
工具推荐:
检查网站是否登录多个重要目录:www.123promotion.co.uk/directory/index.php
付费登录(Paid Inclusion):
英文 Yahoo 实行付费登录商业网站政策,国内的门户搜索引擎目录也对商业网站纷纷采用付费登录。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据的抓取。
总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站来说,还是有必要的。
关于自动登录软件(Submitting Tools):
自从有了 B2B 商务平台和搜索引擎营销以来,就出现了向这些中间平台和搜索引擎提交供求信息或网站的自动登录软件,并一度在市面上广为流行。搜索引擎自动登录软件的功能是承诺将客户的网站一次性登录到全球 N 个搜索引擎目录,有的甚至保证可以使网站在搜索引擎中的排名获得极大提升。实际上,已经有诸多营销实践者对此类自动登录软件实际效果提出了质疑:
1、真正为网站带来访问量的搜索引擎主要集中于几大主流搜索引擎,其它的小搜索引擎搜索量极小,即使网站被这些小搜索引擎收录成功,也不能指望通过他们带来什么访问量。
2、 今天的主流搜索引擎目录往往采用付费登录或严格的人工审核,这些目录极其反感由自动登录软件提交的网站,有的明确提出拒绝自动提交方式。
3、在软件自带的几千个搜索引擎中,软件本身提示登录成功的大概有百分之六七十,是否真正登录成功,实际操作中很难一个一个去检验。
4、 如果网站有来自其它网站的导入链接,即使不用登录,主流搜索引擎机器人同样会抓取到你的网页。
5、如果从增加外部导入链接的角度出发,英文网站针对英文搜索引擎的自动提交可以一试,聊胜于无,但不可对其抱有太大的期望。
总体上,盛行于免费推广时期的自动登录软件在今天各大主流商业推广平台纷纷实施付费政策的商业模式下,已经越来越丧失价值。
                      高质量导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。网站即使没有向目录提交,但由于其他重要网站上有你的网站链接,一样可以获得搜索引擎的快速抓取,并为取得好排名加分。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网站会提及你;对你提及越多,说明价值越大。由此引申出链接广度(Link Popularity)在搜索引擎优化中的重要地位。唯其如此,人们想方设法地为网站“制造”外部链接,导致涌出大量垃圾(spam)链接和网站,于是搜索引擎在算法调整中,仅对高质量的外部链接给予重视,对类似 Spam 的做法往往给予适得其反的结果。
因此,今天对链接广度要有这样的认识:即使获得上百个质量低劣的或内容毫不相干的站点的链接,也抵不上一个高质量且内容高度相关或互补的站点的链接。
链接质量分析:
来自以下网站的链接都可以称为高质量的链接:
  搜索引擎目录中的链接以及已加入目录的网站的链接
  与你的主题相关或互补的网站
  PR 值不低于 4 的网站
  流量大、知名度高、频繁更新的重要网站(如搜索引擎新闻源)
  具有很少导出链接的网站
  以你的关键词在搜索结果中排名前三页的网站
  内容质量高的网站
相比高质量链接,以下链接堪称垃圾链接,对网站排名不起作用或起反作用:
  留言簿、评论或 BBS 中大量发贴夹带网站链接
  已经加入太多导出链接的网站(几十甚至上百个“友情链接”中有一个你的网站)
  加入链接基地(Link Farm)、大宗链接交换程序(bulk link exchange programs)、交
  叉链接(Cross Link) 等链接程序,与大量会员网站自动交换链接,被搜索引擎视为典
  型的垃圾链接,极有可能受到惩罚或牵连。Google 就会对那些使用链接程序的站点进行
  永久性删除。
还有两种导入链接被误认为可以增加链接广度:
  点击付费的搜索引擎广告链接,如百度竞价排名和 Google 的右侧关键词广告。
  多层级的网络会员制联盟(Affiliate program)链接。
这些链接不会直接指向你的网站,而是指向盟主的网站,以方便他们跟踪点击计费,因此不会提高你网站的链接广度。当然,如果你本身主持该会员制联盟,你的服务器就在跟踪会员网站并将它们指回你的站点,这种情况下还是有助于提高你的链接广度。
怎样获得高质量导入链接:
1、 向搜索引擎目录提交网站:
见前文
2、 寻找网站交换链接
俗称友情链接或互惠链接。互惠链接的基础是你的网站内容具有较高质量,否则请求链接不容易成功。交换链接对象包括:
已经加入搜索引擎分类目录的相关网站
所有主要搜索引擎中的与你的行业相关的目录下的网站,都是理想的链接对象。
与你的竞争对手链接的相关网站
要找到这些网站,可以在搜索引擎中输入"link:",跟着输入竞争者的域名,如
"link:theirdomain.com" 和 "link:www.theirdomain.com." 。这样还可以在获得链接的同
时与对手竞争获得目标客户。
生意链中的对象:
竞争对手与你的主题最相关,但交换链接不大可能,因此可以考虑与你的生意链中的上下游合作伙伴,包括分销商,代理商,供应商等的网站交换链接。
容易被找到的相关网站
如那些做搜索引擎广告的网站或其它大力宣传推广的网站,以及自然排名不错的相关网站。
找到以上网站之后,再对其进行链接分析,考察是否属于高质量链接对象。诸如流量 ALEXA 排名、PR 值高低和导出链接的数量都是考察的基本条件。最好为对方提供链接的 HTML 源代码信息,这样链接交换对象只需简单复制这些代码并嵌入自己网页即可。注意,由于你的网站可以通过好几个不同的 URL 达到。比如下面这四个 URL 地址都指向新竞争力的主页:
http://jingzhengli.com/
http://www.jingzhengli.com
http://jingzhengli.com/index.htm
http://www.jingzhengli.com/index.htm
但搜索引擎的链接分析系统视它们为四个完全不同的页面。因此,在交换链接时必须提供一个统一的 URL,一般以符合大多数人群使用习惯的 http://www.yourname.com 为准。
交换链接的过程,是经过对对方网站仔细分析后,通过诚恳的一对一的联系最终获得,而不是漫天撒网的垃圾邮件轰炸来请求交换链接。
3、 网站被主动链接或转载:
这是最获搜索引擎赏识的链接,也是搜索引擎重视外部链接的根本原因。如果你的网站内容丰富,质量高,其它相关网站会主动将你的网站链接到他们的网站。尤其当你的网站提供很多相关免费资源、知识库时,被其它网站链接和转载的机会都很高。
4、 在重要网站发表专业文章:
围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名,或在作者简介中放上你的链接和围绕关键字的网站描述。这样也是既可以获得高质量互惠链接,亦可能获得目标客户。在你的博客日志或个人主页上也不要忘了加上网站链接。注意你发表的每篇文章标题都应该包含关键词在内。
何谓重要网站,指那些流量高,威信度高的网站。个人体会是,可以用你网站的关键词去主流搜索引擎订阅新闻,那些被作为新闻源的网站都被搜索引擎看作重要网站。搜索引擎对这些新闻源每天检索一次,更新频繁,这些网站上的链接自然也成为被更新的对象,效果极佳。
5、 在所在行业目录提交网站
尽可能向更多的相关网络目录、行业目录、商务目录、黄页、白页提交你的网站,加入企业库。
工具推荐:
查询网站有哪些导入链接及数量:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA 排名)
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测 10 个搜索引擎的收录情况)
www.seotoolkit.co.uk/link_popularity_checker.asp
搜索框命令:在 google 中输入:link:www.yourname.com
        在 Yahoo 中输入:link:http://www.yourname.com  导出链接和内部链接
导出链接就是你的网站中指向其它网站的链接。搜索引擎机器人除了分析你的导入链接,也会分析你引出去的站点,如果导出链接站点内容与你的网站主题相关联,同样有利于搜索引擎友好。这也是交换链接要选择主题相关网站的原因。最后,一个网站内页面间的链接也被纳入链接分析之中,影响到网站的页面等级,最终影响排名。
导出链接:
在你的网站上如果增加一些与你关键词有关的行业/专业的资源性网站链接,不仅有利于丰富网站内容,也有利于提升搜索引擎对你网站的好印象。
这一点尤其值得一些站长注意。由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的导出链接是很有必要的。
当然,导出不同于导入,即使主题相关,也要控制数量。因为从“网页级别”的角度看,搜索引擎认为一个页面奉献的导出链接数量越多,则该网站其它页面的受益相应就减少。所以一个页面导出链接数量应受到合理控制,不要超过 15 个。首页的导出链接更要控制在10个以内,多出的应单独安排在次级页面。Google 认为一个页面的最大导出链接数量不应超过 100 个。
内部链接:
除了导入导出链接,一个站点的页面之间也往往彼此链接,如一篇文章结束后的“相关文章”列表,将该网站中同一主题下的其它文章都链接在内,不仅方便访问者,也有利于搜索引擎。网站应有意识将重要内容页面对次链接于其它页面,让搜索引擎知道这是你的重要页面,从 而给予更高的 PR 值,进行重点索引。
网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围主站,对提高排名相当有利。
无论是导出链接还是内部链接,都要保证链接有效而不是死链接,死链过多不仅给用户造成不便,也极不利于搜索引擎友好,影响排名。
附:免费链接检测工具:
1、 Xenu:http://home.snafu.de/tilman/xenulink.html
2、 W3C:http://validator.w3.org/checklink
              关键词链接文本及上下文语意
搜索引擎比较重视链接文本中出现的关键词。因此无论是导出链接、导入链接还是内部链接,都最好兼顾到链接文本中含有关键字。比如导出链接最好选择那些有关键词命名的网站,如一个服装厂商的网站可以在行业资源中添加名称中带有“服装”二字的导出链接。
需要注意的是,如果一个网站的导入链接的文本完全相同,则可能遭致搜索引擎忽略或惩罚。因为搜索引擎希望导入链接是别人自然创建的,这种统一文字使搜索引擎怀疑该网站是为了增加链接广度而进行人为制造的结果。因此网站在对外交换友情链接时最好使用不同的文本,如新竞争力的链接文本就包括“新竞争力”“网络营销管理顾问”“深圳竞争力科技公司” 等。
除了链接文本,链接周围的文字即上下文(Context) 语意也非常重要。链接分析系统通过检查链接上下文内容来确定网站与其链接对象之间的关联度,以评估该页面的内容质量。通过语意分析,也可以判断出关键词是否作弊。
第六部分:走在钢丝上的搜索引擎优化作弊
由于技术型搜索引擎在网站排名过程中完全由蜘蛛程序自动完成,未有人工参与,这为那些针对排名原理而采用欺骗蜘蛛程序的手段提供成功的可能性。因此在 SEO 的发展过程中,一直伴随着关于作弊方法的讨论,成为业界关注的话题。
                        SEO 作弊手段
做 SEO 必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段:
1、关键字堆砌:
为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及URL地址等地方重复书写某关键词的行为(Stuffing)。
2、虚假关键词:
通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用户进入网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
3、 隐形文本/链接:
为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其它页面添加指向目标优化页的行为。
4、 重定向(Re-Direct):
使用刷新标记(Meta Refresh)、CGI程序、Java、Javascrīpt或其它技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
5、 偷换网页:
也称“诱饵行为(Bait-&-Switch)”,是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
6、复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
7、桥页/门页(Bridge/Doorway/Portal/Entry):
针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。
8、隐形页面(Cloaked Page)
指同一个网址下对不同的访问者选择性返回不同的页面内:,搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
9、重复注册:
违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
10、垃圾链接:
加入“链接工厂”(亦称“大量链接机制”)指由大量网页交叉链接而构成的一个网络系统。一个站点加入 “链接工厂”后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要“奉献”自己的链接。籍此方法来提升链接得分。
11、包含指向作弊网页的链接:
这种情况,有的是无辜被作弊网页牵连,有的则是桥页之故。
搜索引擎对作弊的处罚
由于作弊行为完全背离了搜索引擎对搜索结果排名的初衷——对用户有利的原则,破坏了正常的搜索结果,严重影响搜索引擎质量和声誉,并昭示出搜索引擎技术的漏洞,因此作弊行为被搜索引擎厂商深恶痛绝。一旦被侦破为作弊,将视情节轻重给予不同程度的处罚。发生在2005年3月底的Google清理部分垃圾性搜索结果(清理“广告位出租”的SEO垃圾)以及关闭部分作弊情节严重的作弊站长网站事件,就是典型的处罚案例。
搜索引擎技术的发展也是侦破作弊技术的发展。今天,搜索引擎对于蒙蔽它的手段识别技术越来越精,过去可能还行得通的手段在今天就有着被处罚的危险。以下是部分搜索引擎对于作弊行为的处罚:
百度:
根据网页的作弊情况,会受到不同程度的惩罚。
较轻微的惩罚,是系统在给网页排名时略为降低该网页的排名。
较常见的惩罚,是作弊网站的某些关键词(或所有关键词)的排名降到其它任何网站之后。
较严厉的惩罚,对于作弊行为和后果特别恶劣的网站,将从百度中消失。
特别补充,含恶意代码或恶意插件等用户极端反感内容的网页,虽然不是作弊,但只要用户投诉,一经确认也会被百度拒绝收录。
中搜
中搜采用多种方法惩罚作弊。封杀、只索引部分正常内容(不减权)、整个网页排序推后、连带责任。
根据历史纪录,中搜有作弊黑名单,黑名单中的网站是重点防范、监控对象;根据作弊监控算法计算出来分值很高的网站也会被重点审查。
有轻微作弊的基本正常网页,中搜会只收录正常内容,如隐含文字等内容不建索引。
有较多作弊特征的网页会被减权,基本上在前几页没有机会出现。
包含有指向作弊网页的链接的网页会被牵连,承担连带责任。
中搜会搜索引擎技术的各个环节监控作弊,同时重点监控排序剧变的网页,网站不分大小、不分领域、部分亲属远近都受到每周7*24小时的监控。除自动监控系统外,还有一个人工监控小组打击作弊。
Google
Google 没有明确给出处罚条款,但站主通过以下情况可以了解到网站是否受到处罚:
网站的 PageRank 变为“0”
Google 工具栏上的 PageRank 指示为“0”
网站在 Google 的外部链接数变为“0”
Google 工具栏上的 Backlinks 或在 Google 搜索框中键入“link:www.yourdomain.com”命令显示没有外部链。
网站排名骤降
以核心关键词搜索,原有的排名下降明显。不过这种情况有时候是算法更新的原因,与处罚无关。
网站在 Google 中消失
直接输入网址,找不到该网站。
被处罚的网站一般情况下如果解除作弊,还是可以获得“新生”,情况特别严重者除外。
附:向 Google 举报作弊网站:www.google.com/contact/spamreport.html (Googe 的反作
弊技术发展就是基于这类举报中出现的案例)
向百度投诉垃圾网页 http://www.baidu.com/search/spamreport.html

第七部分:网页级别(PageRank)
Google搜索引擎采用的核心软件称为 PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分, PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页级别由此成为Google所有网络搜索工具的基础。
                        网页级别概述
Google对网页级别的描述
“作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它网页的“重要性”。
重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。”
PR值算法原理
总体上基于下面2个前提:
1、一个网页被多次引用,则它可能是很重要的;一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。
这种重要的网页称为权威(Authoritive)网页。
2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值。
                      影响 PR 值的因素
PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、 网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:
  加入搜索引擎分类目录
  与已经加入目录的网站交换链接
  获得来自 PR 值不低于 4 并与你的主题相关或互补的网站的链接
  你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
  与你交换链接的网站具有很少导出链接
  与内容质量高的网站链接(PR 值上升潜力大)
2、 导出链接数量:
根据PR计算原理,由于“一个网页的重要性被平均的传递到它所引用的网页”,因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、 搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。
附:查询网站收录页面数量:在搜索引擎中输入:site:www.yoursite.com(如果输入:
site:yoursite.com,则获得的是在yoursite.com域名下所有二级域名的网页数量)。
工具推荐:
www.marketleap.com/siteindex 可获得网站在多个主流搜索引擎中的网页收录数
4、首页PR的高低
尽管对PR的界定是针对网页而不是网站,但由于每个网页都依托某一网站而存在,首页是推广的核心页面,所以网站首页PR高低对内页各PR也产生直接影响。一般而言,一个网站各页面的PR值呈现以下走向:首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,PR降低1-2个档次。更深层次可能就无法列入评级范围了。当然,如果一个深层内页有很多外部或内部链接,情况则另当别论。
5、文件类型
Google 可以索引到的网页和文件类型包括:pdf、asp、jsp、hdml、shtml、xml、cfm、doc、xls、ppt、rtf、wks、lwp、wri、swf。做成 PDF 格式的文件往往都是网站比较重要的内容或文章。因此 Google 默认 PDF 格式文件的 PR 天生为 3,高于一般 HTML 文件。同理,Google 给予 XML、PS、Word、Power Point、Excel 等类型页面的 PR 也比普通网页文件高。因此,对于网站比较有价值的内容,建议做成 PDF 格式。
6、 PR 值的更新:
Google 每个月进行一次彻底的数据更新(Dance),更新后的网站排名和导入链接都会有某些变化,但其 PR 更新时间一般要延迟至 dance 后三个月左右,而且网站的 PR 值相对稳定,要上升或下降一级 PR 是很不容易的事情。
工具推荐:
查看 PR 值是否处于更新期间:www.seochat.com/seo-tools/future-pagerank (如果结果出现不一致的情况,则处于更新期间)
                        PR 值的作用
由于网页级别的高低直接受链接的影响,而链接仅是 SEO 的一个方面,因此 PR 的高低只能反映出 SEO 的部分效果。一个网页如果拥有高 PR 值能够说明的仅是:
网页比较重要,拥有了排名靠前的优先权,并不能与排名靠前直接划上等号
具有了获得高质量导入链接的谈判优势
搜索引擎会加快对网页数据的更新
看上去挺美
正因为具有了排名靠前的优先权和谈判优势,使得高 PR 网站往往最终确实产生高排名,业内不少人士就干脆直接将 PR 与 SEO 划等号,这不仅不正确,也不利于 SEO 实施。因为 PR 值不高的网站同样有可能获得好的排名,而 PR 高的不见得有理想的排名。并且,在这样的思想指导下,人们往往片面追求链接效应,忽略了 SEO 对于内容、结构、关键词等方面的分析和改进,而后者才是用户和搜索引擎长期关注的焦点。网络营销专家冯英健博士认为:PR值的高低应该是包括 SEO 在内的搜索引擎营销所产生的自然结果而不应作为追求的目标。
结论:在 SEO 的过程中,不能忘记内容建设,不能忘记优质外链,但忘掉 PR 可没什么大不了的。
第八部分:搜索引擎优化管理
如果说搜索引擎优化体现在网站建设和推广的每一个环节,则对搜索引擎优化的管理贯彻于网站推广和维护的长期过程中。在搜索引擎技术不断发展,排名算法不断更新,同行竞争越来越激烈的背景下,任何一个排名的领先或落后都是暂时的现象,没有一劳永逸的结果。只有长期坚持的、优秀的 SEO 管理,才是保持排名优势的不二法门。
                  搜索引擎优化诊断分析
获得专业的搜索引擎优化诊断分析报告,可以使搜索引擎营销策略更有效。新竞争力
www.jingzhengli.cn 公司特别开发出高效的搜索引擎优化诊断分析系统。该诊断指标体系由电子商务博士冯英健自行研究的 68 项评价指标构成,是国内目前最权威的搜索引擎优化评价体系。
将搜索引擎优化诊断分析报告配合新竞争力开发的网站专业性评价系统,可以全方位透彻了解网站的网络营销表现,还可以针对存在的问题获得专家的分析建议。
专业顾问服务推荐:新竞争力搜索引擎优化诊断分析报告 www.jingzhengli.cn/youhua.htm
另外,新竞争力还开发了一个网站搜索引擎优化在线诊断工具,这一诊断工具是免费的,不过在本书发布时这一在线诊断系统仍在测试之中,预计 2005 年 4 月底前后正式发布,届时您可以通过下列网站中的相关介绍获得搜索引擎优化在线诊断的有关信息:
搜索引擎优化 www.sem123.com
深度网络营销 www.jingzhengli.com
新竞争力 www.jingzhengli.cn
作者的 BLOG:www.impics.com
            Google 沙盒效应(Sandbox Effect)
关于Google沙盒现象,业界众说纷纭。基本上可以这样理解:这是Google对于那些刚发布不久就有良好排名的“可疑”站点置于某种屏蔽程序中进行一段时期的“隔离审查”。待网站表现稳定之后,再解除屏蔽,给予其应得的实际排名和PR值。这段时长可能延续3个月左右。之所以出现沙盒现象,主要是Google针对过度进行SEO——尤其采用了作弊手段如“制造”大量导入链接而获得高排名的网站采取的防备措施。因此,如果你的网站在发布不久后以核心关键词在Google排名中出现由高走低的不稳定现象,多半是被Google请进了沙盒。当然,还有一种观点认为:Google为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新发布的网站更多“关照”,使得新网站暂时获得排名优势;但随着Google数据更新不断加快,这种对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容,提高内容质量,获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。
                        网站数据更新
网站经营者都希望发布的重要内容如新产品信息或重要新闻被蜘蛛快速抓取并出现在搜索结果中。但现今我们点击搜索结果中的链接,往往进入后发现内容与结果描述不同,这是因为搜索到的结果是搜索蜘蛛在上次光顾该网站时抓取到的信息,之后该页内容更新,蜘蛛程序却还没有来得及抓取,从而造成的搜索结果与实际内容不符。不过,各搜索引擎都在加快对网站访问的频率,除了每月一次全面的深度检索,还对频繁更新的网站进行数天甚至每天简单检索一次,以保证搜索结果的时效性。总结起来,Google 对网站信息的更新取决于以下因素:
1、网站自身的更新频率
一个长期没有更新的网站,无论是用户和蜘蛛程序都会减少对它的访问。可以说,更新越频繁,蜘蛛程序光顾越多,你的新信息出现在搜索结果首页的机会也越大,被抓取到的网页数量也越多。
2、网站的结构
如果一个网站拥有优化的结构,蜘蛛访问起来很顺利的话,那么它会更乐意访问该网站。
3、服务器的性能
如果蜘蛛程序前来索引你的网站,而你的服务器迟迟不能加载页面,或根本不能访问,那么搜索引擎就会尝试在下一次更新时再来,如果多次出现同样的情况,搜索引擎就会减少对该站的访问,或将它在数据库里删除。
4、PR 值的高低
正如高 PR 值拥有了获得高排名的优势,很多业内人士认为 PR 值的高低同样是搜索引擎判断更新频次的重要因素。
5、Meta“revisit-after”
有人在 Meta 中如下设置:<META NAME="revisit-after" CONTENT="5 days">,以次提示蜘蛛程序每 5 天访问一次。实际上,由于 Google 基本上已经将 Meta 所起的作用降到很低,因此类似标签是没有多大作用的。但是,如果将时间设为 30 天以后的数值,被认为是有效的。
综上所述,网站维护得力,才是搜索引擎经常更新网站数据的根本原因。
                        Google Dance
Google 有 8 个数据中心,共享超过一万台的服务器。一般在每月中下旬开始升级数据库。这期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算法。由于每次升级都会引起很多网站排名波动,俗称 Google Dance。有人则直接把 Google Dance定义成 Google 重新安排它的搜索结果排名的过程。
Google Dance 对于 SEO 来说,涉及的注意事项如下:
1、 网站的提交及更新时间
在 Dance 期间,新网站被收录的机会增大,因此宜在 Dance 其间提交新网站及加大网站更新力度。
2、 静观其变,及时跟进
由于数据调整有一个过程,Dance 期间的普遍表现是排名波动不稳定,忽上忽下。也可能在这期间调整排名算法。宜在 Dance 结束后,针对排名升降结果和竞争对手的排名情况调整自己的 SEO 策略。
工具推荐:
检查是否出现 Google Dance:www.webrankinfo.com/english/tools/Googledance.php
也可以简单地在以下地址输入同样的关键词进行查询:www.google.com、www2.google.com、www3.google.com。如果出现不同数量的搜索结果,则说明 Google 正在经历 Dance。
                        网站流量分析
网站流量统计分析是网站运营和维护的基础工作。在分析访问数据的基础上对网站内容及营销策略进行调整,以期获得更好的营销效果,是进行流量分析的最终目的。获取网站访问统计资料通常有两种方法:一种是通过在自己的网站服务器端安装统计分析软件来进行网站流量监测;另一种是采用第三方提供的网站流量分析服务。
对 SEO 来说,流量分析中有两个重要统计指标:访问来源(Referrer)和搜索使用的关键词,即用户通过哪些链接进入自己的网站,以及通过哪些关键词找到自己。这些链接可能是各大搜索引擎,可能是某些导入链接,也可能就是你发布在某网站上的文章的 URL;而关键词分析则可以了解哪些关键词及组合能带来访问量。这样就对网站的链接及关键词需要强化和弱化的方面了如指掌。
网站访问数据分析对 SEO 的指导是多方面的。但由于市面上大部分流量统计软件目前仅停留在统计数据的罗列上,缺乏对营销指导的结论性报告,因此这些模式化的分析结果实际上只是半成品,还需要网络营销专业人士对这些原始数据进行深度剖析,其对于 SEO 的指导作用才能真正发挥出来。
专业服务推荐:
新竞争力网站访问统计分析:www.jingzhengli.cn/fenxi.htm (可获得访问数据对网络营销的指导意义)
                        SEO 工具/系统
借助一些小工具或网站系统,可以高效、及时地检测、分析网站优化和运营情况,从而指导运营维护工作的深入开展。
搜索引擎及目录免费登录入口:
Google:http://www.Google.com/intl/zh-CN/add_url.html
百度:http://www.Baidu.com/search/url_submit.htm
中搜:http://service.chinasearch.com.c ... rd/frontpageurl.jsp
搜狐:http://db.sohu.com/regurl/regform.asp?Step=REGFORM&;class=
网易:http://seek.163.com/cgi-bin/search/add_url.cgi
新浪:http://bizsite.sina.com.cn/newbizsite/docc/index-2jifu-09.htm
一搜:http://www.yisou.com/search_submit.html?source=yisou_www_hp
雅虎中国目录:http://cn.Yahoo.com/docs/info/suggest.html (分类目录)
DMOZ 目录:http://dmoz.org/World/Chinese_Simplified (分类目录)
英文搜索引擎自动提交:http://www.trafficzap.com/searchsubmit.php
域名与主机工具:
域名批量查询:http://www.whois.sc
IP 转换成域名:http://www.whois.sc/members/reverse-ip.html (查看某 IP 地址下共享哪些域名。免费注册)
关键字工具:
Google AdWords 关键字工具:查询特定关键词的常见查询及扩展匹配
https://adwords.google.com/select/KeywordSandbox
百度关键字工具:查询特定关键词的常见查询、扩展匹配及查询热度
http://www2.baidu.com/inquire/dsquery.php
搜狐关键字工具:关键字搜索热度
http://db.sohu.com/regurl/pv_price/query_consumer.asp
网易关键字工具:关键字搜索热度
http://adpsearch.163.com/find_price.php
Overture 关键字使用频率工具(英文):特定关键词的常见查询及被查询次数
http://inventory.overture.com/d/searchinventory/suggestion
关键字密度检查(英文):频繁出现的关键词及其密度
www.seotoolkit.co.uk/keyword_density_analyser.asp
内容与结构检测工具:
新竞争力网站专业性评价:www.jingzhengli.cn\pingjia.htm (基于数千网站研究获得的
120 项评测指标)
蜘蛛程序模拟器:模拟蜘蛛可抓取到的文本及链接
www.webconfs.com/search-engine-spider-simulator.php
www.spannerworks.com/seotoolkit/spider_viewer.asp
URL 检测工具:检测网站 URL 结构、无效链接等
下载地址: www.wuyue.cn/soft/XENU.ZIP
http://validator.w3.org/checklink
相似页面检测器:对比两个页面间的相似度,来判断是否有受到惩罚的危险
www.webconfs.com/similar-page-checker.php
链接广度检测工具:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA 排名)
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测 10 个搜索引擎的收录情况)
www.seotoolkit.co.uk/link_popularity_checker.asp
www.123promotion.co.uk/directory/index.php(检查网站是否登录多个重要分类目录)
SEO 效果检测工具:
http://www.jingzhengli.com/
排名监测工具:网站以某一关键词在搜索引擎中的排名。
www.cleverstat.com/Google-monitor.htm(查 Google 排名)
www.trafficzap.com/keyrank.php (查 Google、Yahoo 排名)
(注:由于排名检测占用了本来可以用来响应用户请求的服务器资源,违反了 Google 服务
条款。因此 Google 强烈要求不要使用排名检查工具。)
查看网页级别:
Google 工具栏下载:http://toolbar.google.com (PageRank 值)
www.trafficzap.com/pagerank.php (PageRank 值)
www.seochat.com/seo-tools/future-pagerank(查看 PR 值是否处于更新期间)
www.digitalpoint.com/tools/webrank (Yahoo 的 WebRank 值)
查看 ALEXA 网站访问量全球排名:
ALEXA 工具栏下载:http://download.alexa.com/index.cgi?p=Dest_W_b_40_T1
www.trafficzap.com/sitepopularity.php
第九部分:选择正规 SEO 服务商
为了在短期内把客户网站排名“做上去”从而收费,一些低质 SEO 服务商们不惜采用种种危
险的作弊手段,并制造出大量的垃圾链接和垃圾结果,不仅败坏了正规 SEO 的行业名声,也
搅乱了整个市场。对此,Google 特在网站向网站管理员提供的信息中,针对选择“搜索引
擎优化服务商”有如下告诫:
您可以通过某些迹象来判断是否正在与不道德的 SEO 打交道。下面所列出的只是其中很少的一部分,因此,只要有任何疑虑,您都应当相信您的直觉。 如果 SEO 具有以下行为,一定要想尽办法果断摆脱它:
拥有影子域名(即域名重定向)
在桥页上放置指向其他客户的链接
出售在地址栏中输入关键字的功能
对实际搜索结果和搜索结果中的广告不加区分
保证排名,但只依靠随意可得的晦涩冗长的关键字词组
使用多个别名或伪造的 WHOIS 信息(域名注册信息)
从“虚假的”搜索引擎、间谍软件 (spyware) 或变脸软件 (scumware) 获取点击量
自身的域名或者所拥有的域名已从 Google 索引中删除,或者在 Google 的索引中没有被列出。(原文见 Google 官方网站:www.google.com/intl/zh-CN/webmasters/seo.html
结束语:
无论如何,不要作恶——Don’t be evil!
posted on 2007-06-13 14:10  榻榻米  阅读(1235)  评论(1编辑  收藏  举报