理解搜索引擎并且善用google

一个问题:为什么大部分搜索引擎不支持正则匹配?
一个不支持的原因就是性能的开销加大了

为什么要学习搜索引擎

  1. 你去了解别人
    更有效率的获取信息
  2. 让别人了解你
    正所谓酒香也怕巷子深,搜索引擎是互联网的入口,学习她,了解她,有助于更好的和她交流

理解搜索引擎

用一句话来形容搜索引擎就是爬虫,索引,查询,展现技术。
有以下几个方面要注意:

  1. 爬虫
    爬虫的入口:互联网上的信息通过超链接连接起来,超链接可以当作爬虫的主要入口,但是并不是唯一入口
    爬虫获取到网页内容,并进行收录

  2. 索引
    搜索引擎后端对网页关键词建立了索引,建立索引的目的是加快查询速度,不然海量的数据你要跑到什么时候啊
    分词处理

  3. 查询
    用户在搜索框中输入单词,搜索引擎可以找到结果网页,虽然我用一句话描述了这个过程,但是鬼知道这里面逻辑有多么复杂

  4. 展现

  5. 搜索并非实时的,当然各大搜索公司已经尽力向实时靠拢了

google使用技巧

搜索指定站点内容,site:后面可以加域名作为限定
site:
搜索技巧:叶常落 site:jianshu.com

baidu使用技巧

人在江湖飘,抬头不见低头见,百度老大哥我们还是要尊重滴。
在这里插入图片描述

posted @ 2022-03-06 10:38  叶常落  阅读(39)  评论(0编辑  收藏  举报