2010年8月25日
摘要: 目的:从数据库中抽取文章关键词,并统计这些关键词在哪些文章中出现,出现多少次。(算是词袋子模型吧),然后对每篇文章形成形成VSM模型,写成weka的数据格式,然后调用weka对文章聚类。目前“形成此代码模型一块已经完毕”其中词袋子的数据结构如下:map<string,vector<pair<int,int>>>&mymap),目前... 阅读全文
posted @ 2010-08-25 16:47 finallyly 阅读(1057) 评论(7) 推荐(0) 编辑