摘要: 最近在看knn算法,顺便敲敲代码。 knn属于数据挖掘的分类算法。基本思想是在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。俗话叫,“随大流”。 简单来说,KNN可以看成:有那么一堆你已经知道分类的数据,然后当一个新的数据进入的时候,就开始跟训练里的每个 阅读全文
posted @ 2016-11-04 17:39 LC_coding 阅读(13141) 评论(3) 推荐(0) 编辑
摘要: 思路: 只保留奇数 (1)由输入的整数n确定存储奇数(不包括1)的数组大小: n=(n%2==0)?(n/2-1):((n-1)/2);//n为存储奇数的数组大小,不包括基数1 (2)由数组大小n、进程号id和进程数p,确定每个进程负责的基数数组的第一个数、最后一个数和数组维度: low_value 阅读全文
posted @ 2016-10-31 10:56 LC_coding 阅读(2485) 评论(1) 推荐(0) 编辑
摘要: 用c语言写了kmeans算法的串行程序,再用mpi来写并行版的,貌似参照着串行版来写并行版,效果不是很赏心悦目~ 并行化思路: 使用主从模式。由一个节点充当主节点负责数据的划分与分配,其他节点完成本地数据的计算,并将结果返回给主节点。大致过程如下: 1、进程0为主节点,先从文件中读取数据集,然后将数 阅读全文
posted @ 2016-10-30 20:38 LC_coding 阅读(5603) 评论(0) 推荐(0) 编辑
摘要: 最近在苦于思考kmeans算法的MPI并行化,花了两天的时间把该算法看懂和实现了串行版。 聚类问题就是给定一个元素集合V,其中每个元素具有d个可观察属性,使用某种算法将V划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高。 下面是google到该算法的一个流程图 阅读全文
posted @ 2016-10-26 17:06 LC_coding 阅读(7706) 评论(2) 推荐(0) 编辑
摘要: 最近要用到C,所以尝试了这几款windows平台下比较好的IDE。 VS2015:比较复杂和庞大,据说从2013版本开始支持C99标准。 C-free:轻巧,但是不支持C99。 vc++6.0:很多学C语言的人接触的第一款IDE,上世纪的产物。 dev c++:精巧,支持C99。 CodeBlock 阅读全文
posted @ 2016-10-20 16:15 LC_coding 阅读(8351) 评论(0) 推荐(0) 编辑