摘要:
说来这个聚类算法的实现是数据挖掘课程的第三次作业了,前两次的作业都是利用别人的软件,很少去自己实现一个算法,第一个利用sqlserver2008的商业智能工具实现一个数据仓库,数据处理,仓库模型的建立绕,维度表,事实表的创建,不过考试的时候应该也会有数据仓库常用模型的建立吧;第二次利用weka的分类和关联规则算法跑一些提供的数据,其实那些算法的参数原理都不晓得; 不过这次的聚类作业竟然是实现一个自己的算法针对提供的数据进行聚类,先描述一下提供的要聚类的数据,主要是两个数据集: 针对数据集1能够很清楚的看出聚类的意图,但是数据集2不太明白数据聚类的意图;针对数据集1可以看出利用欧几里得距离... 阅读全文