会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lucky_pin
博客园
首页
新随笔
联系
订阅
管理
2017年7月4日
用python做一个搜索引擎(Pylucene)
摘要: 搜索引擎是“对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集、信息整理和用户查询三部分”。如图1是搜索引擎的一般结构,信息搜集模块从网络采集信息到网络信息库之中(一般使用爬虫);然后信息整理模块对采集的信息进行分词、去停用词、赋权重等操作后建立索引表(一般是倒排索引)构成索引库;最后
阅读全文
posted @ 2017-07-04 16:30 lucky_pin
阅读(12559)
评论(0)
推荐(0)
编辑
公告