上一页 1 2 3 4 5 6 7 8 ··· 18 下一页

2021年11月13日

1.hadoop

摘要: 1: hadoop 核心组件 Hadoop是所有搜索引擎的共性问题的廉价解决方案 如何存储持续增长的海量网页: 单节点 V.S. 分布式存储 如何对持续增长的海量网页进行排序: 超算 V.S. 分布式计算 HDFS 解决分布式存储问题 MapReduce 解决分布式计算问题 Hadoop Commo 阅读全文

posted @ 2021-11-13 23:41 paike123 阅读(61) 评论(0) 推荐(0) 编辑

2021年11月6日

4.决策树算法api

摘要: 1决策树算法api class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None) criterion 特征选择标准 "gini"或者"entropy",前者代表基尼系数,后者 阅读全文

posted @ 2021-11-06 22:48 paike123 阅读(106) 评论(0) 推荐(0) 编辑

3.决策树算法-特征工程-特征提取

摘要: 什么是特征提取呢? 1.1 定义 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 注:特征值化是为了计算机更好的去理解数据 特征提取分类: 字典特征提取(特征离散化) 文本特征提取 图像特征提取(深度学习将介绍) 1.2 特征提取API sklearn.feature_extraction 阅读全文

posted @ 2021-11-06 22:32 paike123 阅读(744) 评论(0) 推荐(0) 编辑

2.决策树算法-cart剪枝

摘要: 1 为什么要剪枝 •横轴表示在决策树创建过程中树的结点总数,纵轴表示决策树的预测精度。 •实线显示的是决策树在训练集上的精度,虚线显示的则是在一个独立的测试集上测量出来的精度。 •随着树的增长,在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。 出现这种情况的原因: • 阅读全文

posted @ 2021-11-06 22:19 paike123 阅读(136) 评论(0) 推荐(0) 编辑

1. 决策树算法简介

摘要: 1. 决策树算法简介 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节 阅读全文

posted @ 2021-11-06 22:12 paike123 阅读(1098) 评论(0) 推荐(0) 编辑

3-Roc曲线绘制

摘要: 关于ROC曲线的绘制过程,通过以下举例进行说明 假设有6次展示记录,有两次被点击了,得到一个展示序列(1:1,2:0,3:1,4:0,5:0,6:0),前面的表示序号,后面的表示点击(1)或没有点击(0)。 然后在这6次展示的时候都通过model算出了点击的概率序列。 下面看三种情况。 1 曲线绘制 阅读全文

posted @ 2021-11-06 10:12 paike123 阅读(320) 评论(0) 推荐(0) 编辑

2:逻辑回归-分类评估方法

摘要: 1.分类评估方法 1.1 精确率与召回率 1.1.1 混淆矩阵 在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类) 1.1.2 精确率(Precision)与召回率(Recall) 精确率:预 阅读全文

posted @ 2021-11-06 10:08 paike123 阅读(194) 评论(0) 推荐(0) 编辑

1:逻辑回归介绍

摘要: 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 1 逻辑回归的应用场景 广告点击率 是否为垃圾邮件 是否患病 金融诈骗 虚假账号 看到上面的例子,我们 阅读全文

posted @ 2021-11-06 09:23 paike123 阅读(408) 评论(0) 推荐(0) 编辑

2021年11月4日

5.线性回归-欠拟合和过拟合以及过拟合时的解决方法-正则化

摘要: 1 定义 过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂) 欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简 阅读全文

posted @ 2021-11-04 21:47 paike123 阅读(2017) 评论(0) 推荐(0) 编辑

4.线性回归api与波士顿房价预测案例

摘要: 线性回归api再介绍 sklearn.linear_model.LinearRegression(fit_intercept=True) 通过正规方程优化 fit_intercept:是否计算偏置 LinearRegression.coef_:回归系数 LinearRegression.interc 阅读全文

posted @ 2021-11-04 21:15 paike123 阅读(255) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 ··· 18 下一页

导航