2010年8月18日
摘要: 最近在读洞庭散人的程序《基于K-means文本聚类》,作为C++学习的起航船。发现他的代码无法运行。而且代码中有错误。于是就在此开博更正。代码Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/--#include<iostream>#includ... 阅读全文
posted @ 2010-08-18 16:25 finallyly 阅读(2372) 评论(10) 推荐(0) 编辑
摘要: 作者:finallyliuyu (资料使用,博文引用请您表面出处)本专题是有关借助于Lucene.Net工具如何对英文文章进行分词,词性标注,词根还原的。如果是借助于Lucene.net框架对中文进行分词,词性标注,那么原理上更简单。我在《也谈贝叶斯分类C#版》中给出了如何在Lucene中嵌入河北理工大学吕震宇老师(根据张华平老师的ICTCLAS分词开源版本改写成)的sharpICT.需要指出但是... 阅读全文
posted @ 2010-08-18 12:21 finallyly 阅读(2501) 评论(11) 推荐(3) 编辑