06 2020 档案

摘要:一、sklearn数据集变换 数据预处理、特征抽取、 特征变换、 维数约简 二、Pipeline和FeatureUnion 三、特征抽取之字典向量化和哈希变换 特征抽取: Feature Extraction Loading Feature From Dicts Features hashing T 阅读全文
posted @ 2020-06-21 23:42 败家小林 阅读(227) 评论(0) 推荐(0)
摘要:分类器性能评估指标 一、精度-召回率-F度量 Precision-Recall-F_measure 准确率和混淆矩阵 二、损失函数 Loss Function 三、接收机操作曲线 ROC Curve 回归器效能评估方法 阅读全文
posted @ 2020-06-18 23:17 败家小林 阅读(789) 评论(0) 推荐(0)
摘要:一、Estimator对象的score方法 二、在交叉验证中使用score参数 在交叉验证中使用预定义scoring参数 在交叉验证中使用自定义scoring参数 三、使用sklearn.metric中的性能度量函数 阅读全文
posted @ 2020-06-15 23:08 败家小林 阅读(222) 评论(0) 推荐(0)
摘要:一、数据集划分方法 model_seletion下的方法 k折交叉验证 留一法 随机划分法 二、超参数优化方法 课程内容 什么是超参数 网格搜索穷举式超参数优化方法 随机采样式超参数优化方法 三、超参数空间的搜索技巧 四、模型验证方法 通过交叉验证计算得分 对每个输入数据点产生交叉验证估计 计算并绘 阅读全文
posted @ 2020-06-15 23:00 败家小林 阅读(338) 评论(0) 推荐(0)
摘要:一、python科学计算环境 Python库: pandas、numpy、scipy、Scikit-Image、Scikit-Learn、matplotlib 功能介绍 二、SKlearn算法库的顶层设计 SKlearn监督学习的各个模块 SKlearn无监督学习模块 SKlearn数据变换模块 S 阅读全文
posted @ 2020-06-11 21:13 败家小林 阅读(457) 评论(0) 推荐(0)
摘要:一、监督学习 监督学习的概念与数学形式 统计机器学习的三要素 统计学习方法: 模型+策略+算法 监督学习的三个问题 分类、回归、标注 学习过程: 在假设空间执行搜索优化,挑选最好的学习器模型 预测过程: 使用训练好的学习器对未见过得新样本实例作出预测,推断其类别! 学习器的评价指标:精确率、召回率 阅读全文
posted @ 2020-06-09 22:39 败家小林 阅读(225) 评论(0) 推荐(0)
摘要:一、矩阵 奇异值分解及作用 行列式 线性代数 阅读全文
posted @ 2020-06-08 19:55 败家小林 阅读(352) 评论(0) 推荐(0)
摘要:本福特定律 概率公式 贝叶斯公式 重要分布 Beta分布 事件的独立性 期望与方差 协方差 Pearson相关系数 切比雪夫不等式 大数定律 中心极限定理 最大似然估计 阅读全文
posted @ 2020-06-03 22:33 败家小林 阅读(294) 评论(0) 推荐(0)
摘要:数学分析 1、知识回忆 2、导数 3、梯度 阅读全文
posted @ 2020-06-01 23:01 败家小林 阅读(315) 评论(0) 推荐(0)