摘要: 1.1. 索引和搜索流程图 1、绿色表示索引过程,对要搜索的原始内容进行索引构建一个索引库, 索引过程包括:确定原始内容即要搜索的内容->采集文档->创建文档->分析文档->索引文档 2、红色表示搜索过程,从索引库中搜索内容, 搜索过程包括:用户通过搜索界面->创建查询->执行搜索,从索引库搜索-> 阅读全文
posted @ 2018-11-18 15:59 人生如&逆旅 阅读(791) 评论(0) 推荐(0) 编辑
摘要: 1.1. 数据分类 数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等磁盘上的文件 1.2. 非结构化数据查询方法 (1)顺序扫描法(Serial Scanning) 顺序扫 阅读全文
posted @ 2018-11-18 15:37 人生如&逆旅 阅读(546) 评论(0) 推荐(0) 编辑