摘要: 为了生存,就得干一行爱一行。那就学习下lucene吧。全文检索介绍流程:建索引准备待搜索文档文档分词:将文档分成一个个单独的单词,去除标点符号、停词(无意义的冠词介词等),得到token语言处理:统一小写,单词缩减或转变为词根形式,得到term索引:用term创建字典,term->doc,对字典按字... 阅读全文
posted @ 2014-10-11 14:55 春文秋武 阅读(280) 评论(0) 推荐(0) 编辑