摘要:
决策树 通常决策树主要有三种实现,分别是ID3算法,CART算法和C4.5算法。 随机森林的重点在于单个决策树是如何建造的 CART Classification And Regression Tree,即分类回归树算法,简称CART算法,它是决策树的一种实现. CART算法是一种二分递归分割技术, 阅读全文
摘要:
一、\(R^{2}\)、RSS、TSS、ESS 局部加权回归 二、二分类:Logistic回归 广义线性模型 对数线性模型 Logistic回归的损失 指数族 多分类:Softmax回归 二、AUC 阅读全文
摘要:
最小二乘 使用最大似然估计解释最小二乘 中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关 高斯分布:若连续型随机变量X的概率密度为:\(f\left ( x \right )=\frac{1}{\sqrt{2\pi }\sigma }e 阅读全文
摘要:
预备知识:最大似然估计 概念与解释 具体实践操作 举例 主要内容 PCA方法在鸢尾花样本中的应用 PCA主方向的选择 阅读全文
摘要:
一、sklearn数据集变换 数据预处理、特征抽取、 特征变换、 维数约简 二、Pipeline和FeatureUnion 三、特征抽取之字典向量化和哈希变换 特征抽取: Feature Extraction Loading Feature From Dicts Features hashing T 阅读全文
摘要:
分类器性能评估指标 一、精度-召回率-F度量 Precision-Recall-F_measure 准确率和混淆矩阵 二、损失函数 Loss Function 三、接收机操作曲线 ROC Curve 回归器效能评估方法 阅读全文
摘要:
一、Estimator对象的score方法 二、在交叉验证中使用score参数 在交叉验证中使用预定义scoring参数 在交叉验证中使用自定义scoring参数 三、使用sklearn.metric中的性能度量函数 阅读全文
摘要:
一、数据集划分方法 model_seletion下的方法 k折交叉验证 留一法 随机划分法 二、超参数优化方法 课程内容 什么是超参数 网格搜索穷举式超参数优化方法 随机采样式超参数优化方法 三、超参数空间的搜索技巧 四、模型验证方法 通过交叉验证计算得分 对每个输入数据点产生交叉验证估计 计算并绘 阅读全文
摘要:
一、python科学计算环境 Python库: pandas、numpy、scipy、Scikit-Image、Scikit-Learn、matplotlib 功能介绍 二、SKlearn算法库的顶层设计 SKlearn监督学习的各个模块 SKlearn无监督学习模块 SKlearn数据变换模块 S 阅读全文
摘要:
一、监督学习 监督学习的概念与数学形式 统计机器学习的三要素 统计学习方法: 模型+策略+算法 监督学习的三个问题 分类、回归、标注 学习过程: 在假设空间执行搜索优化,挑选最好的学习器模型 预测过程: 使用训练好的学习器对未见过得新样本实例作出预测,推断其类别! 学习器的评价指标:精确率、召回率 阅读全文