摘要: 原文地址http://www.cnblogs.com/phinecos/archive/2007/11/20/965835.html一、环境:1.操作系统:windowsXp,windows2000+2.java1.6,设置JAVA_HOME到环境变量3.cygwin,当然这个不是必需的,只是nutch提供的脚本只能在shell环境下使用,所以使用cygwin来虚拟shell命令。4.nutch版... 阅读全文
posted @ 2009-11-22 23:03 Alexander 阅读(447) 评论(1) 推荐(0) 编辑
摘要: vi 是visual edit 的缩写 文本编辑器是所有计算机系统中最常用的一种工具。UNIX下的编辑器有ex,sed和vi等,其中,使用最为广泛的是vi,而vi命令繁多。进入vi的命令。 进入vi的命令 vi filename: 打开或新建文件,并将光标置于第一行首 vi +n filename: 打开文件,并将光标置于第n行首 vi + filename: 打开文件,并将光标置于最后一行首 v... 阅读全文
posted @ 2009-11-22 23:01 Alexander 阅读(214) 评论(0) 推荐(0) 编辑
摘要: Lucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展从Lucene我们还可以学到什么 基于Java的全文... 阅读全文
posted @ 2009-11-22 22:59 Alexander 阅读(321) 评论(2) 推荐(0) 编辑