机器学习算法辨别
分类器:
0.最近邻: 样本无穷多
新样本与已知样本做比较,找到距离最近的已知样本,以该样本类别作为新样本的类别.
1.KNN:多分类 非线性 样本无穷多
K近邻,若一个样本在K个最相似的样本中的大多数(投票机制)属于一个类别,则该样本判定为属于这个大多数类别。
其算法的描述为:
1)计算测试数据与各个训练数据之间的距离;
2)按照距离的递增关系进行排序;(计算和储存成本大,分支限界 改进)
3)选取距离最小的K个点;
4)确定前K个点所在类别的出现频率;
5)返回前K个点中出现频率最高的类别作为测试数据的预测分类。
2.SVM:支持向量机(Support Vector Machine, SVM)的基本模型是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大。
3.K-Means:K-Means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分。并通过划分后的均值迭代优化获得最优的聚类结果。迭代停止条件为各类均值收敛??
4.感知器 二分类 线性分类模型
-------------------------------------------------------------逆水行舟,不进则退。