随笔分类 -  Search Engine

摘要:倒排索引是搜索引擎中最为核心的一项技术之一,可以说是搜索引擎的基石。可以说正是有了倒排索引技术,搜索引擎才能有效率的进行数据库查找、删除等操作。1. 倒排索引的思想 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记... 阅读全文
posted @ 2015-09-08 14:35 Poll的笔记 阅读(5234) 评论(0) 推荐(6) 编辑
摘要:随着互联网的大力发展,互联网称为信息的主要载体,而如何在互联网中搜集信息是互联网领域面临的一大挑战。网络爬虫技术是什么?其实网络爬虫技术就是指的网络数据的抓取,因为在网络中抓取数据是具有关联性的抓取,它就像是一只蜘蛛一样在互联网中爬来爬去,所以我们很形象地将其称为是网络爬虫技术。其中网络爬虫也被... 阅读全文
posted @ 2015-09-04 00:33 Poll的笔记 阅读(6985) 评论(1) 推荐(1) 编辑
摘要:本文主要总结了搜索引擎的基本知识,包括搜索引擎的分类以及搜索引擎基础架构的构建和介绍。搜索引擎的三大环节主要有搜集信息、组织和处理信息以及展示信息。 阅读全文
posted @ 2015-09-02 11:34 Poll的笔记 阅读(6294) 评论(0) 推荐(0) 编辑