摘要:
#include <stdio.h>#include <stdlib.h> char chr_legal[] = "abcdefghijklmnopqrstuvwxyz0123456789_-./";int chr_idx[256] = {0};char idx_chr[256] = {0}; #define FNAME 0typedef struct trie_t *trie, trie_t;struct trie_t { trie next[sizeof(chr_legal)]; /* next letter; slot 0 is for fil 阅读全文
摘要:
该程序是基于 linux 和 c 语言运用倒排索引原理实现的一个本地搜索程序。分为两个部分:统计部分,搜索部分。统计部分:1 首先由用户提供的要统计路径开始向下遍历,根据后缀名筛选出要统计的文件,由零开始依此往后编号并写入名为“textfile.t”的文件。2 从 textfile.t 中读入需要统计的文件,抽取出其中的字符串,对应上文档号,在内存中用快速排序对其排序写入后缀名为“i"的文件中,每个这样的文件最多能写入 150000 个单元。至此将得到诸多后缀名为”i”的文件,这些文件是在单个文件内部是呈字典序的,整体上是无序的。3 用多路归并树归并这些文件,一定数量后将存储到硬盘, 阅读全文