随笔分类 -  scikit-learn笔记

摘要:1 概述 1.1 决策树是如何工作的 1.2 构建决策树 1.2.1 ID3算法构建决策树 1.2.2 简单实例 1.2.3 ID3的局限性 1.3 C4.5算法 & CART算法 1.3.1 修改局部最优化条件 1.3.2 连续变量处理手段 1.4 sklearn中的决策树 2 DecisionT 阅读全文
posted @ 2019-04-10 23:30 耐烦不急 阅读(9675) 评论(2) 推荐(4) 编辑
摘要:我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上) Scikit-learn 0.20.0 (你的版本至少要0.19) Graphviz 0.8.4 (没有画不出决策树哦,安装代码conda install python-graphv 阅读全文
posted @ 2019-04-10 23:17 耐烦不急 阅读(3933) 评论(0) 推荐(0) 编辑
摘要:sklearn中的朴素贝叶斯 1 概述 1.1 真正的概率分类器 1.2 朴素贝叶斯是如何工作的 1.2.1 瓢虫冬眠:理解P(Y|X) 1.2.2 贝叶斯的性质与最大后验估计 1.2.3 汉堡称重:连续型变量的概率估计 1.3 sklearn中的朴素贝叶斯 2 不同分布下的贝叶斯 2.1 高斯朴素 阅读全文
posted @ 2019-03-19 10:31 耐烦不急 阅读(63) 评论(0) 推荐(0) 编辑
摘要:sklearn中的线性回归大家族 1 概述 1.1 线性回归大家族 1.2 sklearn中的线性回归 2 多元线性回归LinearRegression 2.1 多元线性回归的基本原理 2.2 最小二乘法求解多元线性回归的参数 2.3 linear_model.LinearRegression 3 阅读全文
posted @ 2019-03-19 10:29 耐烦不急 阅读(12) 评论(0) 推荐(0) 编辑
摘要:sklearn中的支持向量机SVM(下) 1 二分类SVC的进阶 1.1 SVC用于二分类的原理复习 1.2 参数C的理解进阶 1.3 二分类SVC中的样本不均衡问题:重要参数class_weight 2 SVC的模型评估指标 2.1 混淆矩阵(Confusion Matrix) 2.1.1 模型整 阅读全文
posted @ 2019-03-19 10:22 耐烦不急 阅读(26) 评论(0) 推荐(0) 编辑
摘要:sklearn中的支持向量机SVM(上) 1 概述 1.1 支持向量机分类器是如何工作的 1.2 支持向量机原理的三层理解 1.3 sklearn中的支持向量机 2 sklearn.svm.SVC 2.1 线性SVM用于分类的原理 2.1.1 线性SVM的损失函数详解 2.1.2 函数间隔与几何间隔 阅读全文
posted @ 2019-03-19 10:20 耐烦不急 阅读(33) 评论(0) 推荐(0) 编辑
摘要:sklearn中的数据预处理和特征工程1 概述 1.1 数据预处理与特征工程 1.2 sklearn中的数据预处理和特征工程2 数据预处理 Preprocessing & Impute 2.1 数据无量纲化 2.2 缺失值 2.3 处理分类型特征:编码与哑变量 2.4 处理连续型特征:二值化与分段3 阅读全文
posted @ 2019-03-18 21:11 耐烦不急 阅读(44) 评论(0) 推荐(0) 编辑
摘要:随机森林在sklearn中的实现:随机森林 1 概述 1.1 集成算法概述 1.2 sklearn中的集成算法 2 RandomForestClassifier 2.1 重要参数 2.1.1 控制基评估器的参数 2.1.2 n_estimators 2.1.3 random_state 2.1.4 b 阅读全文
posted @ 2019-03-13 17:28 耐烦不急 阅读(120) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示