理解搜索引擎并且善用google
一个问题:为什么大部分搜索引擎不支持正则匹配?
一个不支持的原因就是性能的开销加大了
为什么要学习搜索引擎
- 你去了解别人
更有效率的获取信息 - 让别人了解你
正所谓酒香也怕巷子深,搜索引擎是互联网的入口,学习她,了解她,有助于更好的和她交流
理解搜索引擎
用一句话来形容搜索引擎就是爬虫,索引,查询,展现技术。
有以下几个方面要注意:
-
爬虫
爬虫的入口:互联网上的信息通过超链接连接起来,超链接可以当作爬虫的主要入口,但是并不是唯一入口
爬虫获取到网页内容,并进行收录 -
索引
搜索引擎后端对网页关键词建立了索引,建立索引的目的是加快查询速度,不然海量的数据你要跑到什么时候啊
分词处理 -
查询
用户在搜索框中输入单词,搜索引擎可以找到结果网页,虽然我用一句话描述了这个过程,但是鬼知道这里面逻辑有多么复杂 -
展现
-
搜索并非实时的,当然各大搜索公司已经尽力向实时靠拢了
google使用技巧
搜索指定站点内容,site:后面可以加域名作为限定
site:
搜索技巧:叶常落 site:jianshu.com
baidu使用技巧
人在江湖飘,抬头不见低头见,百度老大哥我们还是要尊重滴。