ML - 文章分类 - Holly_U

机器学习-聚类

摘要：前面，提到聚类是无监督学习中应用最广泛的。聚类定义对大量无label的数据集按照样本点之间的内在相似性进行分类，将数据集分为多个类别，使得划分为相同类别的数据的相似度比较大。被划分的每个类称为cluster, 距离/相似度计算欧式距离 n维空间的任意两点,,之间的距离,由向量性质就是，这本质阅读全文

posted @ 2018-04-01 22:33 Holly_U 阅读(340) 评论(0) 推荐(0)

机器学习--支持向量机

摘要：线性可分SVM hard margin maximization 线性SVM soft margin maximization 非线性SVM kernel function 线性可分SVM hard margin maximization 线性SVM kernel function 线性可分SVM 阅读全文

posted @ 2018-03-30 22:42 Holly_U 阅读(239) 评论(0) 推荐(0)

机器学习-决策树与随机森林

摘要：依然从一个例子出发，就是周志华老师的西瓜书的例子案例生活中，我们经常会遇到这种问题，我们的决策过程就是下图所示过程那么，我们如何决策才使得我们最终挑选的瓜是好瓜的概率大呢？即，我们每一步该根据那个特征来做决定呢？这里就会用到信息熵的概念，与通信原理中信息熵的原理是相同的（不知道的可以看周志华老阅读全文

posted @ 2018-03-27 11:32 Holly_U 阅读(460) 评论(0) 推荐(0)

机器学习算法--logistic回归

摘要：logitic回归其实是用来做分类的，既然是做做分类的，那就以吴恩达课程中提到的肿瘤是良性的还是恶性的。而且，，所以，想到了sigmoid 函数 sigmoid函数则，，下面分析如何找到我们的模型，是事件发生的概率，从概率论角度出发，这是一个0-1分布问题，，则，所以，联合概率密度为（这里认为阅读全文

posted @ 2018-03-26 11:33 Holly_U 阅读(278) 评论(0) 推荐(0)

机器学习常用算法 --线性回归

摘要：前言最近在看吴恩达在Coursera上的机器学习课程，并做了相关作业，https://github.com/Emma-uestc/machine-learning但Coursera经常就上不去了，所以还会再看看书，这里把自己所学及自己的理解做一个整理。机器学习是什么当然，首先它是Machine 阅读全文

posted @ 2018-03-25 22:02 Holly_U 阅读(408) 评论(0) 推荐(0)

Emma_U

文章分类 - ML

公告