文章分类 -  ML

摘要:前面,提到聚类是无监督学习中应用最广泛的。 聚类 定义 对大量无label的数据集按照样本点之间的内在相似性进行分类,将数据集分为多个类别,使得划分为相同类别的数据的相似度比较大。被划分的每个类称为cluster, 距离/相似度计算 欧式距离 n维空间的任意两点,,之间的距离,由向量性质就是,这本质 阅读全文
posted @ 2018-04-01 22:33 Holly_U 阅读(340) 评论(0) 推荐(0)
摘要:线性可分SVM hard margin maximization 线性SVM soft margin maximization 非线性SVM kernel function 线性可分SVM hard margin maximization 线性SVM kernel function 线性可分SVM 阅读全文
posted @ 2018-03-30 22:42 Holly_U 阅读(239) 评论(0) 推荐(0)
摘要:依然从一个例子出发,就是周志华老师的西瓜书的例子 案例 生活中,我们经常会遇到这种问题,我们的决策过程就是下图所示过程 那么,我们如何决策才使得我们最终挑选的瓜是好瓜的概率大呢?即,我们每一步该根据那个特征来做决定呢?这里就会用到信息熵的概念,与通信原理中信息熵的原理是相同的(不知道的可以看周志华老 阅读全文
posted @ 2018-03-27 11:32 Holly_U 阅读(460) 评论(0) 推荐(0)
摘要:logitic回归其实是用来做分类的,既然是做做分类的,那就以吴恩达课程中提到的肿瘤是良性的还是恶性的。 而且,,所以,想到了sigmoid 函数 sigmoid函数 则,,下面分析如何找到我们的模型,是事件发生的概率,从概率论角度出发,这是一个0-1分布问题,,则 ,所以,联合概率密度为(这里认为 阅读全文
posted @ 2018-03-26 11:33 Holly_U 阅读(278) 评论(0) 推荐(0)
摘要:前言 最近在看吴恩达在Coursera上的机器学习课程,并做了相关作业,https://github.com/Emma-uestc/machine-learning但Coursera经常就上不去了,所以还会再看看书,这里把自己所学及自己的理解做一个整理。 机器学习是什么 当然,首先它是Machine 阅读全文
posted @ 2018-03-25 22:02 Holly_U 阅读(408) 评论(0) 推荐(0)