11 2012 档案

搜索引擎lucene实现--二半吊子的论调之Document和Field
摘要:本来打算先写写analysis包,因为那个组件包是基础。但写着写着就觉得没有入口的说明,就跳到那一部分实在对不起自己和各位的理解。于是咱就先看看Document和Field,这两个用于索引和查询的数据结构。我们大多数人用过数据库,知道一个表里面的一行。如粗糙的下图所示:这个是关系型数据库的典型存储方式。我们在进行数据查询的时候,也是提供字段值或者是模式等条件。那么lucene作为一个全文检索的解决方案,从表面来看,也是类似于关系型数据库方式。它为我们提供了统一的数据索引接口(IndexWriter)和查询接口(IndexSearcher)。在我们这次要说明的Document和Field,我们也 阅读全文

posted @ 2012-11-25 15:59 eric_chen 阅读(5034) 评论(2) 推荐(1) 编辑

搜索引擎lucene实现--二半吊子的论调之体系结构
摘要:写这个东西就是两个目的,一是让自己头脑清醒,一是让别人把咱的头脑弄清醒。技术这个东西跟本能一个样,只要你愿意用成就本能的方式去学习技术,谁都可以成就自己。因为咱不是文科出身,工作了六年,也没有那些牛逼人士的韧力和魄力,曾经就想着能多写写技术博客,但总是没有坚持下去(深叹一口气,你可别像我这样。。)。前些日子又看了一下《康熙王朝》(陈道明演的),被里面的一句话(一言之虚,百患丛生; 一事之虚,遗害终生。)给击蒙了,于是重新想着坚持下去。刚好要跟同事分享lucene,那么也就多学,多看,多想,多写了。OK,言归正传,到底搜索引擎有多神秘?对我来说,lucene的出现,没有多少影响,因为当初我还在一 阅读全文

posted @ 2012-11-18 20:18 eric_chen 阅读(3336) 评论(2) 推荐(1) 编辑

点击右上角即可分享
微信分享提示