上一页 1 2 3 4 5 6 ··· 10 下一页
摘要: 数据探索性分析(EDA) 什么是EDA 在拿到数据后,首先要进行的是数据探索性分析(Exploratory Data Analysis),它可以有效的帮助我们熟悉数据集、了解数据集。初步分析变量间的相互关系以及变量与预测值之间的关系,并且对数据进行初步处理,如:数据的异常和缺失处理等,以便使数据集的 阅读全文
posted @ 2020-08-04 20:05 闲酒肆中听风吟 阅读(2556) 评论(1) 推荐(0) 编辑
摘要: 随机森林:是bagging装袋法的代表。弱学习器只可以是决策树 简介: 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为“代表集成学习技术水平的方法”。 随机森林的随机性体现在哪几个 阅读全文
posted @ 2020-08-03 23:06 闲酒肆中听风吟 阅读(855) 评论(0) 推荐(0) 编辑
摘要: 集成学习 集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通 过在数据上构建多个模型,集成所有模型的建模结果。 集成算法的目标 集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或分类表现。 阅读全文
posted @ 2020-08-03 22:27 闲酒肆中听风吟 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 决策树 认识决策树 决策树(Decision Tree)是一种有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策(基于分类或者回归)规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种集成算法 阅读全文
posted @ 2020-07-31 19:34 闲酒肆中听风吟 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 支持向量机SVM概述 支持向量机(SVM,也称为支持向量网络),是机器学习中获得关注最多的算法没有之一。 从实际应用来看 SVM在各种实际问题中都表现非常优秀。它在手写识别数字和人脸识别中应用广泛,在文本和超文本的分类中举足轻重。同时,SVM也被用来执行图像的分类,并用于图像分割系统。除此之外,生物 阅读全文
posted @ 2020-07-30 20:53 闲酒肆中听风吟 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 无监督学习与聚类算法 概述 在此之前我们所学习到的算法模型都是属于有监督学习的模型算法,即模型需要的样本数据既需要有特征矩阵X,也需要有真实的标签y。那么在机器学习中也有一部分的算法模型是属于无监督学习分类的,所谓的无监督学习是指模型只需要使用特征矩阵X即可,不需要真实的标签y。那么聚类算法就是无监 阅读全文
posted @ 2020-07-30 17:32 闲酒肆中听风吟 阅读(717) 评论(0) 推荐(0) 编辑
摘要: 分类模型的评价指标 问题:如何评判两部手机的好坏? 1.根据性能评价 2.根据外观评价 3.根据价格评价 分析:如果对一个事物进行好坏的评价,首先我们一定是在指定场景下,使用符合该场景相关的评价标准对其进行好坏的评价!那么归于分类模型的评价有如下几种方式: 准确率 精准率 召回率 f1-Score 阅读全文
posted @ 2020-07-28 20:00 闲酒肆中听风吟 阅读(392) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归 在之前的课程中我们已经学习接触过相关的回归模型了,我们知道回归模型是用来处理和预测连续型标签的算法。然而逻辑回归,是一种名为“回归”的线性分类器,其本质是由线性回归变化而来的,一种广泛使用于分类问题中的广义回归算法。要理解逻辑回归从何而来,得要先理解线性回归。线性回归是机器学习中最简单的的 阅读全文
posted @ 2020-07-27 22:07 闲酒肆中听风吟 阅读(366) 评论(0) 推荐(0) 编辑
摘要: WOE&IV编码&分箱 IV的概念和作用 概念: IV的全称是Information Value,中文意思是信息价值,或者信息量。 作用: 我们构建分类模型时,经常需要对特征进行筛选。比如我们有200个候选特征,通常情况下,不会直接把200个特征直接放到模型中去进行训练,而是会用一些方法,从这200 阅读全文
posted @ 2020-07-27 21:20 闲酒肆中听风吟 阅读(4189) 评论(0) 推荐(1) 编辑
摘要: 朴素贝叶斯算法 概率基础 算法介绍 引出 在许多分类算法应用中,特征和标签之间的关系并非是决定性的。比如说,我们想预测一个人究竟是否会在泰坦尼克号海难中生存下来,那我们可以建立某个分类模型来学习我们的训练集。在训练中,其中一个人的特征为:30岁,男,普 通舱,他最后在泰坦尼克号海难中去世了。当我们测 阅读全文
posted @ 2020-07-23 23:08 闲酒肆中听风吟 阅读(500) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 10 下一页