随笔分类 -  Java框架-搜索引擎框架

摘要:1、Nutch 是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 阅读全文
posted @ 2018-04-28 11:46 杨斌_济南 阅读(228) 评论(0) 推荐(0) 编辑
摘要:lucene全文检索 全文检索是计算机程序通过扫描文章中的每一个词, 对每一个词建立一个索引, 指明该词在文章中出现的次数和位置。 当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程 阅读全文
posted @ 2018-04-28 11:45 杨斌_济南 阅读(244) 评论(0) 推荐(0) 编辑
摘要:优点 分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。 实时分析的分布式搜索引擎。 可以扩展到上百台服务器,处理PB级别的结构化或非结构化数据。 阅读全文
posted @ 2018-04-28 11:44 杨斌_济南 阅读(324) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示