上一页 1 ··· 3 4 5 6 7 8 9 10 下一页
摘要: "1. 特征工程之特征预处理" "2. 特征工程之特征选择" 1. 前言 当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。 2. 特征选择的方法 通常来说,从两个方面考虑来选择特征: + 特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上 阅读全文
posted @ 2018-11-16 10:17 hyc339408769 阅读(3490) 评论(0) 推荐(0) 编辑
摘要: "1. 特征工程之特征预处理" "2. 特征工程之特征选择" 1. 前言 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限” ,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征 阅读全文
posted @ 2018-11-14 23:13 hyc339408769 阅读(4958) 评论(0) 推荐(0) 编辑
摘要: "1. 集成学习(Ensemble Learning)原理" "2. 集成学习(Ensemble Learning)Bagging" "3. 集成学习(Ensemble Learning)随机森林(Random Forest)" "4. 集成学习(Ensemble Learning)Adaboost 阅读全文
posted @ 2018-11-14 11:54 hyc339408769 阅读(4299) 评论(0) 推荐(0) 编辑
摘要: "1. 集成学习(Ensemble Learning)原理" "2. 集成学习(Ensemble Learning)Bagging" "3. 集成学习(Ensemble Learning)随机森林(Random Forest)" "4. 集成学习(Ensemble Learning)Adaboost 阅读全文
posted @ 2018-11-12 22:31 hyc339408769 阅读(6488) 评论(0) 推荐(0) 编辑
摘要: 1. 前言 在机器学习的分类问题领域中,有两个平分秋色的算法,就是 "逻辑回归" 和 "支持向量机" ,这两个算法个有千秋,在不同的问题中有不同的表现效果,下面我们就对它们的区别和联系做一个简单的总结。 2. LR和SVM的联系 1. 都是监督的分类算法。 2. 都是线性分类方法 (不考虑核函数时) 阅读全文
posted @ 2018-11-11 20:29 hyc339408769 阅读(10405) 评论(0) 推荐(3) 编辑
摘要: "1. 感知机原理(Perceptron)" "2. 感知机(Perceptron)基本形式和对偶形式实现" "3. 支持向量机(SVM)拉格朗日对偶性(KKT)" "4. 支持向量机(SVM)原理" "5. 支持向量机(SVM)软间隔" "6. 支持向量机(SVM)核函数" 1. 前言 之前介绍了 阅读全文
posted @ 2018-11-10 20:24 hyc339408769 阅读(15425) 评论(0) 推荐(0) 编辑
摘要: 1. 前言 在机器学习中,不同的问题对应了不同的损失函数,不同的损失函数也直接会影响到收敛的快慢和结果的好坏,下面就从不同的损失函数的角度进行一下梳理。 2. 0 1损失函数 0 1损失是指,预测值和目标值不相等为1,否则为0 3. log对数损失函数 "逻辑回归" 的损失函数就是对数损失函数,在逻 阅读全文
posted @ 2018-11-10 08:47 hyc339408769 阅读(4412) 评论(0) 推荐(0) 编辑
摘要: "1. 感知机原理(Perceptron)" "2. 感知机(Perceptron)基本形式和对偶形式实现" "3. 支持向量机(SVM)拉格朗日对偶性(KKT)" "4. 支持向量机(SVM)原理" "5. 支持向量机(SVM)软间隔" "6. 支持向量机(SVM)核函数" 1. 前言 在前一篇 阅读全文
posted @ 2018-11-10 08:43 hyc339408769 阅读(6909) 评论(0) 推荐(1) 编辑
摘要: "1. 感知机原理(Perceptron)" "2. 感知机(Perceptron)基本形式和对偶形式实现" "3. 支持向量机(SVM)拉格朗日对偶性(KKT)" "4. 支持向量机(SVM)原理" "5. 支持向量机(SVM)软间隔" "6. 支持向量机(SVM)核函数" 1. 前言 在我没有学 阅读全文
posted @ 2018-11-08 19:02 hyc339408769 阅读(8716) 评论(0) 推荐(0) 编辑
摘要: 1. 前言 在NLP中有几个经典的序列标注问题,词性标注(POS),chunking和命名实体识别(NER)。序列标注器的输出可用于另外的应用程序。例如,可以利用在用户搜索查询上训练的命名实体识别器来识别关键词,从而触发某些产品广告。另一个例子是搜索引擎可以使用这种标签信息来查找相关的网页。 2. 阅读全文
posted @ 2018-11-08 17:31 hyc339408769 阅读(6486) 评论(0) 推荐(1) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 下一页