摘要: 第10章 kNN:推荐系统 k近邻算法(k-Nearest Neighbors, kNN):思路是,要预测某个点是哪一类,就看离它最近的k个点是哪一类,根据少数服从多数的原则预测目标点的类别。 代码实现: 应用算法: 计算预测与实际不符的观测数与总观测数: 也就是说,准确率为93% 接下来用R语言中 阅读全文
posted @ 2016-10-23 21:02 gy_jerry 阅读(364) 评论(0) 推荐(0) 编辑
摘要: 第9章 MDS:可视化地研究参议员相似性 基于相似性聚类:本章的主旨是,对不同的观测记录,如何理解用距离的概念来阐明它们之间的相似性和相异性。 多维定标技术(multidimensional scaling, MDS),目的是基于观察值之间的距离度量进行聚类。只通过所有点之间的距离度量对数据进行可视 阅读全文
posted @ 2016-10-23 16:49 gy_jerry 阅读(481) 评论(0) 推荐(0) 编辑