2021年11月6日

4.决策树算法api

摘要: 1决策树算法api class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None) criterion 特征选择标准 "gini"或者"entropy",前者代表基尼系数,后者 阅读全文

posted @ 2021-11-06 22:48 paike123 阅读(106) 评论(0) 推荐(0) 编辑

3.决策树算法-特征工程-特征提取

摘要: 什么是特征提取呢? 1.1 定义 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 注:特征值化是为了计算机更好的去理解数据 特征提取分类: 字典特征提取(特征离散化) 文本特征提取 图像特征提取(深度学习将介绍) 1.2 特征提取API sklearn.feature_extraction 阅读全文

posted @ 2021-11-06 22:32 paike123 阅读(744) 评论(0) 推荐(0) 编辑

2.决策树算法-cart剪枝

摘要: 1 为什么要剪枝 •横轴表示在决策树创建过程中树的结点总数,纵轴表示决策树的预测精度。 •实线显示的是决策树在训练集上的精度,虚线显示的则是在一个独立的测试集上测量出来的精度。 •随着树的增长,在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。 出现这种情况的原因: • 阅读全文

posted @ 2021-11-06 22:19 paike123 阅读(136) 评论(0) 推荐(0) 编辑

1. 决策树算法简介

摘要: 1. 决策树算法简介 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节 阅读全文

posted @ 2021-11-06 22:12 paike123 阅读(1098) 评论(0) 推荐(0) 编辑

3-Roc曲线绘制

摘要: 关于ROC曲线的绘制过程,通过以下举例进行说明 假设有6次展示记录,有两次被点击了,得到一个展示序列(1:1,2:0,3:1,4:0,5:0,6:0),前面的表示序号,后面的表示点击(1)或没有点击(0)。 然后在这6次展示的时候都通过model算出了点击的概率序列。 下面看三种情况。 1 曲线绘制 阅读全文

posted @ 2021-11-06 10:12 paike123 阅读(320) 评论(0) 推荐(0) 编辑

2:逻辑回归-分类评估方法

摘要: 1.分类评估方法 1.1 精确率与召回率 1.1.1 混淆矩阵 在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类) 1.1.2 精确率(Precision)与召回率(Recall) 精确率:预 阅读全文

posted @ 2021-11-06 10:08 paike123 阅读(194) 评论(0) 推荐(0) 编辑

1:逻辑回归介绍

摘要: 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 1 逻辑回归的应用场景 广告点击率 是否为垃圾邮件 是否患病 金融诈骗 虚假账号 看到上面的例子,我们 阅读全文

posted @ 2021-11-06 09:23 paike123 阅读(408) 评论(0) 推荐(0) 编辑

导航