天下之事,必先处之难,而后易之。
君临
知我者谓我心忧,不知我者谓我何求
何为SEO?

SEO是由英 文Search Engine Optimization缩写而来, 中文意译为“搜索引擎优化”,是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中关键词的自然排名,获得更 多的展现量,吸引更多目标客户点击访问网站,从而达到网络营销及品牌建设的目标。

作为一个SEO初学者,首先要做的并不是急于学习发外链,静态化,meta设置等,而是去理解SEO的原理以及作用。因此,我要先给大家讲解一下搜索引擎的原理,帮助大家更好地理解SEO。


 

今 天我主要讲一下网页抓取程序——蜘蛛(Spider),有的地方也叫机器人(robot)。蜘蛛是搜索引擎的一个自动应用程序,它的作用很简单,就是在互 联网中浏览信息,然后把这些信息都抓取到搜索引擎的服务器上,再建立索引库等操作。我们可以把蜘蛛当作采集网站内容的工具,因此越是有利于爬取的操作,就 越有利于SEO。其实,蜘蛛的工作也挺简单,具体步骤参见下图。

这里提到一点重要的信息:蜘蛛爬取的是网站代码内容,而不是我们看到的显示内容,因此没有文本化直接从数据库中读取的内容,引擎是获取不到的。如:https://x.hs.net/html/apiservice/apilist.html


显示内容:

代码内容:

蜘蛛爬取的是第二个页面,而我们真的是要把这个代码的内容给引擎看吗?显然不会。


下面介绍一下蜘蛛抓取网页的规律


1、深度优先

搜索引擎蜘蛛在一个页面发现一个链接后顺着这个链接爬下去,然后在下一个页面又发现一个链接,这样一个页面接一个页面,直到抓取全部链接,这就是深度优先抓取策略。这里告诉SEOER们,做好网站内链的重要性,一定要用绝对地址。


2、宽度优先

搜索引擎蜘蛛先把整个页面的链接全部抓取一次,然后再抓取下一个页面的全部链接。宽度优先主要告诉SEOER们,不要把网站的目录设置太多,层次要清楚。


3、权重优先

这个比较好理解,主要是搜索引擎蜘蛛比较喜欢爬取质量好的链接内容。例如网易首页面,蜘蛛经常来,而不是很好的网站,蜘蛛就很少来。权重优先对SEOER的提醒是做质量好的外链很重要。


4、重访抓取

例如,搜索引擎蜘蛛前一天抓取了某网站的页面,而第二天该网站又增加了新的内容,那么搜索引擎蜘蛛就可以再次抓取到新的内容。长此以往,该网站在蜘蛛的“印象”中就很友好了。这个重访抓取策略不仅对SEOER有用,对网站建设也很有用:时时更新网站内容,也能使客户体验提升。


以上介绍了蜘蛛的爬取方式与内容,你应该理解为什么SEOER这么注重代码问题,URL设置,与原创更新了吧。

原文地址:http://rdcqii.hundsun.com/portal/article/427.html

posted on 2016-06-29 13:46  boonya  阅读(449)  评论(0编辑  收藏  举报

我有佳人隔窗而居,今有伊人明月之畔。
轻歌柔情冰壶之浣,涓涓清流梦入云端。
美人如娇温雅悠婉,目遇赏阅适而自欣。
百草层叠疏而有致,此情此思怀彼佳人。
念所思之唯心叩之,踽踽彳亍寤寐思之。
行云如风逝而复归,佳人一去莫知可回?
深闺冷瘦独自徘徊,处处明灯影还如只。
推窗见月疑是归人,阑珊灯火托手思忖。
庐居闲客而好品茗,斟茶徐徐漫漫生烟。

我有佳人在水之畔,瓮载渔舟浣纱归还。
明月相照月色还低,浅近芦苇深深如钿。
庐山秋月如美人衣,画堂春阁香气靡靡。
秋意幽笃残粉摇曳,轻轻如诉画中蝴蝶。
泾水潺潺取尔浇园,暮色黄昏如沐佳人。
青丝撩弄长裙翩翩,彩蝶飞舞执子手腕。
香带丝缕缓缓在肩,柔美体肤寸寸爱怜。
如水之殇美玉成欢,我有佳人清新如兰。
伊人在水我在一边,远远相望不可亵玩。