摘要: 决策树 通常决策树主要有三种实现,分别是ID3算法,CART算法和C4.5算法。 随机森林的重点在于单个决策树是如何建造的 CART Classification And Regression Tree,即分类回归树算法,简称CART算法,它是决策树的一种实现. CART算法是一种二分递归分割技术, 阅读全文
posted @ 2020-07-09 23:25 败家小林 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 一、\(R^{2}\)、RSS、TSS、ESS 局部加权回归 二、二分类:Logistic回归 广义线性模型 对数线性模型 Logistic回归的损失 指数族 多分类:Softmax回归 二、AUC 阅读全文
posted @ 2020-07-08 21:51 败家小林 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 最小二乘 使用最大似然估计解释最小二乘 中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关 高斯分布:若连续型随机变量X的概率密度为:\(f\left ( x \right )=\frac{1}{\sqrt{2\pi }\sigma }e 阅读全文
posted @ 2020-07-07 22:26 败家小林 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 预备知识:最大似然估计 概念与解释 具体实践操作 举例 主要内容 PCA方法在鸢尾花样本中的应用 PCA主方向的选择 阅读全文
posted @ 2020-07-06 21:45 败家小林 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 一、sklearn数据集变换 数据预处理、特征抽取、 特征变换、 维数约简 二、Pipeline和FeatureUnion 三、特征抽取之字典向量化和哈希变换 特征抽取: Feature Extraction Loading Feature From Dicts Features hashing T 阅读全文
posted @ 2020-06-21 23:42 败家小林 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 分类器性能评估指标 一、精度-召回率-F度量 Precision-Recall-F_measure 准确率和混淆矩阵 二、损失函数 Loss Function 三、接收机操作曲线 ROC Curve 回归器效能评估方法 阅读全文
posted @ 2020-06-18 23:17 败家小林 阅读(762) 评论(0) 推荐(0) 编辑
摘要: 一、Estimator对象的score方法 二、在交叉验证中使用score参数 在交叉验证中使用预定义scoring参数 在交叉验证中使用自定义scoring参数 三、使用sklearn.metric中的性能度量函数 阅读全文
posted @ 2020-06-15 23:08 败家小林 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 一、数据集划分方法 model_seletion下的方法 k折交叉验证 留一法 随机划分法 二、超参数优化方法 课程内容 什么是超参数 网格搜索穷举式超参数优化方法 随机采样式超参数优化方法 三、超参数空间的搜索技巧 四、模型验证方法 通过交叉验证计算得分 对每个输入数据点产生交叉验证估计 计算并绘 阅读全文
posted @ 2020-06-15 23:00 败家小林 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 一、python科学计算环境 Python库: pandas、numpy、scipy、Scikit-Image、Scikit-Learn、matplotlib 功能介绍 二、SKlearn算法库的顶层设计 SKlearn监督学习的各个模块 SKlearn无监督学习模块 SKlearn数据变换模块 S 阅读全文
posted @ 2020-06-11 21:13 败家小林 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 一、监督学习 监督学习的概念与数学形式 统计机器学习的三要素 统计学习方法: 模型+策略+算法 监督学习的三个问题 分类、回归、标注 学习过程: 在假设空间执行搜索优化,挑选最好的学习器模型 预测过程: 使用训练好的学习器对未见过得新样本实例作出预测,推断其类别! 学习器的评价指标:精确率、召回率 阅读全文
posted @ 2020-06-09 22:39 败家小林 阅读(217) 评论(0) 推荐(0) 编辑