随笔分类 - 机器学习
Matlab——逻辑回归(原理、代码)
摘要:对于一个机器学习方法,通常由模型、策略和算法3个要素构成。 模型是假设空间的形式,如是线性函数还是条件概率; 策略是判断模型好坏的数学表达式,将学习问题转化为优化问题,一般策略对应一个代价函数(Cost Function); 算法是上述优化问题的求解方法,有多种方法,如梯度下降法、直接求导、遗传算法
Python——Kmeans聚类算法、轮廓系数(算法理论、代码)
摘要:K-means算法是一种 无监督学习 方法,是最普及的聚类算法,算法使用 一个没有标签 的数据集,然后将数据聚类成不同的组。
K-means算法具有一个迭代过程,在这个过程中,数据集被分组成若干个预定义的不重叠的聚类或子组,使簇的内部点尽可能相似,同时试图保持簇在不同的空间,它将数据点分配给簇,以便簇的质心和数据点之间的 平方距离之和最小 ,在这个位置,簇的质心是簇中数据点的算术平均值。