摘要: 假设有N个待聚类的样本,对于层次聚类来说,步骤: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度; 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算新生成的这个类与各个旧类之间的相似度; 4、重复2和3直到所有样本点都归 阅读全文
posted @ 2017-03-06 20:10 静悟生慧 阅读(1489) 评论(0) 推荐(0) 编辑
摘要: 3. K-means 算法: 3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一 3.2 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一 聚类中的对象相似度较高;而不同聚类中的对象相似度较小。 3.3 算法思想: 以空间中k个点为中心 阅读全文
posted @ 2017-03-06 16:56 静悟生慧 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 1. 综述 1.1 Cover和Hart在1968年提出了最初的邻近算法 1.2 分类(classification)算法 1.3 输入基于实例的学习(instance-based learning), 懒惰学习(lazy learning) 3. 算法详述 3.1 步骤: 为了判断未知实例的类别, 阅读全文
posted @ 2017-03-06 14:56 静悟生慧 阅读(589) 评论(0) 推荐(0) 编辑
摘要: SVM 应用实例(人脸识别): from __future__ import print_function from time import time import logging import matplotlib.pyplot as plt from sklearn.cross_validati 阅读全文
posted @ 2017-03-06 13:09 静悟生慧 阅读(9481) 评论(1) 推荐(1) 编辑
摘要: 1. 一个简单的SVM实例: 2. 稍微复杂一点的线性可分SVM 结果如下: Missing parentheses in call to 'print'——python语法错误 这个消息的意思是你正在试图用python3.x来运行一个只用于python2.x版本的python脚本。 print"H 阅读全文
posted @ 2017-03-06 10:45 静悟生慧 阅读(918) 评论(0) 推荐(0) 编辑
摘要: 1. scikit-learn简单介绍 scikit-learn是一个基于NumPy、SciPy、Matplotlib的开源机器学习工具包。採用Python语言编写。主要涵盖分类、 回归和聚类等算法,比如knn、SVM、逻辑回归、朴素贝叶斯、随机森林、k-means等等诸多算法,官网上代码和文档 都 阅读全文
posted @ 2017-03-06 10:14 静悟生慧 阅读(321) 评论(0) 推荐(0) 编辑