摘要: 对于文本信息的向量化,Mahout 已经提供了工具类,它基于 Lucene 给出了对文本信息进行分析,然后创建文本向量。mahout提供下面两个命令来将文本转成向量形式(转化成向量后可以聚类):1.mahout seqdirectory:将文本文件转成SequenceFile文件,SequenceF... 阅读全文
posted @ 2015-04-26 19:35 孟想阳光 阅读(335) 评论(0) 推荐(0) 编辑
摘要: mvn compile/test都没报错,但是执行mvn package和mvn clean时候就报错:a required class was missing while executing.......这时候只要更改中央仓库就可以解决问题了,具体步骤如下:1.默认中央仓库在C盘.m2中,这样非常... 阅读全文
posted @ 2015-04-26 17:31 孟想阳光 阅读(4329) 评论(0) 推荐(0) 编辑