Atitit 文档全文索引的索引种类 用于文本数据挖掘 搜索 数据分析 目录 1.1. Txt摘要索引。。 1 1.2. File placeholder 索引 1 1.3. Lucence索引 1

Atitit 文档全文索引的索引种类 用于文本数据挖掘 搜索 数据分析

 

目录

1.1. Txt摘要索引。。 1

1.2. File placeholder 索引 1

1.3. Lucence索引 1

2. 与源文件位置关联 1

3. 索引文件的互相转换 2

4. 索引的增量更新 2

 

 

    1. Txt摘要索引。。

搜索方法,使用notepad++ 遍历搜索

 

    1. File placeholder 索引

索引方法,使用everthing文件搜索工具搜索

 

 

    1. Lucence索引

搜索方法,使用api或nuke工具搜索

NLP(自然语言处理)

 

  1. 与源文件位置关联

直接在索引文件里面写入法。。这个比较好。

索引文件命名上目录结构与元文件相同。。

 

 

  1. 索引文件的互相转换

Txt摘要索引 转换 placeholder·索引,转换lucence索引

 

  1. 索引的增量更新

要有个index log 记录更新情况表  按照年月日,,或者主题来更新比较好。

 

posted @ 2019-05-07 14:21  attilaxAti  阅读(32)  评论(0编辑  收藏  举报