摘要: 在我将要实现的仿照博客园搜索功能的简易网站中,需要用到Lucene.net进行查询,因此我整理了一下我收集的资料。现实世界中包含两种类型的数据:结构化数据和非结构化数据结构化数据很容易进行搜索,比如数据库包含的就是结构化数据,可以利用sql进行查询。但是对于非结构化数据,比如word、txt文件中包含的内容则属于非结构化数据。要对这些数据进行查找,只能采用顺序扫描的方式,但是顺序扫描的方式速度很慢。但是在Lucene的世界中,把所有数据都作为字符串来处理,通过Lucene来进行查找,通常会分成两步,一步就是创建索引,另一步就是查找索引。因为创建好的索引属于结构化数据,所以可以很快的进行查找。并 阅读全文
posted @ 2012-12-13 23:49 baidixing 阅读(7931) 评论(15) 推荐(3) 编辑