上一页 1 ··· 6 7 8 9 10
摘要: 1. 前言 贝叶斯学派很古老,但是从诞生到一百年前一直不是主流。主流是频率学派。频率学派的权威皮尔逊和费歇尔都对贝叶斯学派不屑一顾,但是贝叶斯学派硬是凭借在现代特定领域的出色应用表现为自己赢得了半壁江山。 贝叶斯学派的思想可以概括为 先验概率+数据=后验概率 。也就是说我们在实际问题中需要得到的后验 阅读全文
posted @ 2018-10-01 16:46 hyc339408769 阅读(5021) 评论(0) 推荐(0) 编辑
摘要: 1. 前言 说到朴素贝叶斯算法,首先牵扯到的一个概念是 判别式和生成式 。 判别式:就是直接学习出特征输出$Y$和特征$X$之间的关系,如决策函数$Y=f(X)$,或者从概率论的角度,求出条件分布$P(Y|X)$。代表算法有 决策树、KNN、逻辑回归、支持向量机、随机条件场CRF等 生成式:就是直接 阅读全文
posted @ 2018-10-01 16:45 hyc339408769 阅读(8575) 评论(0) 推荐(0) 编辑
摘要: 1. 信息熵 熵度量了事物的不确定性,越不确定的事物,它的熵就越大。在没有外部环境的作用下,事物总是向着熵增大的方向发展,所以熵越大,可能性也越大。 $$ H(X)= \sum_{i=1}^np_{(i)}logp_{(i)} $$ 2. 条件熵 X确定时,Y的不确定性度量。 在X发生是前提下,Y发 阅读全文
posted @ 2018-10-01 15:11 hyc339408769 阅读(3516) 评论(0) 推荐(0) 编辑
摘要: "1. K近邻算法(KNN)" "2. KNN和KdTree算法实现" 1. 前言 K近邻法(k nearest neighbors,KNN)是一种很基本的机器学习方法了,在我们平常的生活中也会不自主的应用,就是“ 物以类聚,人以群分 ”。比如,我们判断一个人的人品,只需要观察他来往最密切的几个人的 阅读全文
posted @ 2018-09-27 22:34 hyc339408769 阅读(9760) 评论(0) 推荐(0) 编辑
摘要: "1. 感知机原理(Perceptron)" "2. 感知机(Perceptron)基本形式和对偶形式实现" "3. 支持向量机(SVM)拉格朗日对偶性(KKT)" "4. 支持向量机(SVM)原理" "5. 支持向量机(SVM)软间隔" "6. 支持向量机(SVM)核函数" 1. 前言 感知机是1 阅读全文
posted @ 2018-09-26 14:09 hyc339408769 阅读(61605) 评论(6) 推荐(8) 编辑
摘要: "1. 数据不平衡的数据处理" "2. 数据不平衡的分类器评价指标" 1. 分类器评价指标 1.1 混淆矩阵 在数据不平衡的分类任务中,我们不在使用准确率当作模型性能度量的指标,而是使用 混淆矩阵、精准率、召回率、F1值当作模型的性能度量指标 。 TP(True Positive):真实是正例,预测 阅读全文
posted @ 2018-09-21 20:10 hyc339408769 阅读(8237) 评论(0) 推荐(2) 编辑
摘要: "1. 数据不平衡的数据处理" "2. 数据不平衡的分类器评价指标" 1. 前言 什么是不平衡数据呢?顾名思义即我们的数据集样本类别比例不均衡。数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下 阅读全文
posted @ 2018-09-21 19:31 hyc339408769 阅读(8504) 评论(0) 推荐(1) 编辑
摘要: 1. 前言 模型的评估方法主要是针对有监督学习的。 2. 数据集划分方法 我们在拿到数据的时候,数据的表现形式会呈现多种多样性,我们首先需要做的是把数据格式化,把数据处理成计算机可以认识的结构。处理数据的过程叫做特征工程,特征工程是一个在机器学习的过程中,非常重要的一个过程,特征工程做的好坏,会直接 阅读全文
posted @ 2018-09-21 13:35 hyc339408769 阅读(5310) 评论(0) 推荐(0) 编辑
摘要: 1. 基本概念 偏差:偏差度量了学习算法的期望预测与真实结果的偏离程度, 即刻画了学习算法本身的拟合能力 。 方差:方差度量了同样大小的训练集的变动所导致的学习性能的变化, 即刻画了数据扰动所造成的影响 。 欠拟合:模型的经验误差大,模型太简单,在训练的过程中基本没学到有价值的内容,说明模型欠拟合。 阅读全文
posted @ 2018-09-21 13:33 hyc339408769 阅读(7233) 评论(0) 推荐(1) 编辑
摘要: 1. 机器学习的定义 [Mitchell, 1997]对机器学习给出了一个形式化的定义: 假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。 2. 机器学习的基本概念 1. 特征向量(feature vect 阅读全文
posted @ 2018-09-21 13:18 hyc339408769 阅读(6153) 评论(1) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10