机器学习 - 随笔分类 - Theext

机器学习—模型选择与优化7-2（网格搜索优化）

摘要：使用网格搜索优化钻石价格模型主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 处理缺失数据 3.2 处理类别型字段 3.2.1 统计类别型字段 3.2.2 字符编码和独热编码 3.3 生成自变量和因变量 3.4 拆分数据集 3.5 特征缩放 4. 构建最优模型 5. 应用网阅读全文

posted @ 2022-03-23 00:07 Theext 阅读(237) 评论(0) 推荐(0)

机器学习—模型选择与优化7-1（k-fold交叉验证法）

摘要：使用k-fold交叉验证法选择最优钻石价格模型主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 处理缺失数据 3.2 处理类别型字段 3.2.1 统计类别型字段 3.2.2 字符编码和独热编码 3.3 生成自变量和因变量 3.4 拆分数据集 3.5 特征缩放 4. 构建不同阅读全文

posted @ 2022-03-22 23:54 Theext 阅读(803) 评论(0) 推荐(0)

机器学习—降维-特征选择6-6（局部线性嵌入法/流形降维）

摘要：使用局部线性嵌入法（流形降维）对瑞士卷数据集降维主要步骤流程： 1. 导入包 2. 生成瑞士卷数据集 3. 可视化瑞士卷数据集 4. 不同自变量个数对应的重建误差 5. 可视化LLE降维效果 1. 导入包 In [1]: # 导入包 import numpy as np import matplo 阅读全文

posted @ 2022-03-17 00:14 Theext 阅读(474) 评论(0) 推荐(0)

机器学习—降维-特征选择6-5（LDA方法）

摘要：使用LDA对糖尿病数据集降维主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用 LDA 降维 4.1 使用 LDA 降维 4.2 验证 X_train_lda 的由来 5. 构建阅读全文

posted @ 2022-03-17 00:05 Theext 阅读(344) 评论(0) 推荐(0)

机器学习—降维-特征选择6-4（PCA-Kernel方法）

摘要：使用PCA核方法对糖尿病数据集降维主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用 Kernel PCA 降维 5. 构建逻辑回归模型 5.1 使用原始数据构建逻辑回归模型 5 阅读全文

posted @ 2022-03-16 23:47 Theext 阅读(529) 评论(0) 推荐(0)

机器学习—降维-特征选择6-3（PCA）

摘要：使用PCA对糖尿病数据集降维主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用PCA降维 4.1 使用 PCA 生成新的自变量 4.2 验证PCA转换规则 4.2.1 打印旧的自阅读全文

posted @ 2022-03-16 21:46 Theext 阅读(1048) 评论(0) 推荐(0)

机器学习—降维-特征选择6-2（包装法）

摘要：使用包装法对糖尿病数据集降维（递归特征消除法）主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 拆分训练集和测试集 3.4 特征缩放 4. 使用递归特征消除法降维 5. 得到降维后的自变量数据集链接：https://www. 阅读全文

posted @ 2022-03-16 21:19 Theext 阅读(221) 评论(0) 推荐(0)

机器学习—降维-特征选择6-1（过滤法）

摘要：使用过滤法对糖尿病数据集降维主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 4. 使用不同的统计指标做特征选择 4.1 使用方差指标 4.2 使用卡方检验指标 5. 构建逻辑回归模型并评估模型性能 5.1 使用原始数据构建阅读全文

posted @ 2022-03-16 21:10 Theext 阅读(306) 评论(0) 推荐(0)

机器学习—聚类5-3（DBSCAN算法）

摘要：使用DBSCAN对环形数据做聚类主要步骤流程： 1. 导入包 2. 生成数据并可视化 3. 使用DBSCAN做聚类并可视化 3.1 参数组合1 3.2 参数组合2 3.3 参数组合3 3.4 参数组合4 4. 使用K-Means做聚类并可视化 5. 打印调整兰德指数 1. 导入包 In [2]: 阅读全文

posted @ 2022-03-15 18:50 Theext 阅读(571) 评论(0) 推荐(0)

机器学习—聚类5-2（轮廓系数）

摘要：使用轮廓系数评估超市客户分组效果主要步骤流程： 1. 导入包 2. 导入数据集 3. 使用K-Means算法得到不同K值对应的WCSS4. 使用K-Means算法得到不同K值对应的轮廓系数 3.1 生成WCSS 3.2. 画出 K值 vs WCSS 图 4. 使用K-Means算法得到不同K值对应阅读全文

posted @ 2022-03-15 18:41 Theext 阅读(1006) 评论(0) 推荐(0)

机器学习—聚类5-1（K-Means算法+瑞士卷）

摘要：使用K-Means对超市客户分组主要步骤流程： 1. 导入包 2. 导入数据集 3. 使用肘部法则选择最优的K值 4. 使用K=5做聚类 5. 可视化聚类效果 6. 采取措施 7. 瑞士卷生产及其聚类数据集链接：https://www.heywhale.com/mw/dataset/623069 阅读全文

posted @ 2022-03-15 18:34 Theext 阅读(476) 评论(0) 推荐(0)

机器学习—回归与分类4-4（支持向量机算法）

摘要：使用支持向量机预测黑色星期五花销主要步骤流程：数据集链接：https://www.cnblogs.com/ojbtospark/p/16005660.html 1. 导入包 In [ ]: # 导入包 import numpy as np import pandas as pd 2. 导入数据集阅读全文

posted @ 2022-03-15 18:22 Theext 阅读(242) 评论(0) 推荐(0)

机器学习—回归与分类4-3（AdaBoost算法）

摘要：使用AdaBoost预测黑色星期五花销主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 删除无用的列 3.3 检查类别型变量 3.4 标签编码&独热编码 3.5 得到自变量和因变量 3.6 拆分训练集和测试集 3.7 特征缩放 4. 使用不同的参数阅读全文

posted @ 2022-03-15 18:06 Theext 阅读(669) 评论(0) 推荐(0)

机器学习—回归与分类4-2（随机森林算法）

摘要：使用随机森林预测德国人信贷风险主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 处理类别型变量 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建随机森林模型 4.1 模型1：构建随机森林模型 4.1 阅读全文

posted @ 2022-03-15 17:33 Theext 阅读(401) 评论(0) 推荐(0)

机器学习—回归与分类4-1（决策树算法）

摘要：使用决策树预测德国人信贷风险主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 处理类别型变量 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建决策树模型 4.1 模型1：构建决策树模型 4.1.1 阅读全文

posted @ 2022-03-15 17:14 Theext 阅读(297) 评论(0) 推荐(0)

机器学习—分类3-4（逻辑回归与ROC）

摘要：基于逻辑回归预测客户是否购买汽车新车型ROC曲线主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理4. 构建逻辑回归模型 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4.构建逻辑回归模型 5. 手工画阅读全文

posted @ 2022-03-15 17:08 Theext 阅读(296) 评论(0) 推荐(0)

机器学习—分类3-3（逻辑回归算法）

摘要：基于逻辑回归预测客户是否购买汽车新车型主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建逻辑回归模型 4.1 模型1：构建逻辑回归阅读全文

posted @ 2022-03-15 17:06 Theext 阅读(272) 评论(0) 推荐(0)

机器学习—分类3-2（朴素贝叶斯算法）

摘要：基于朴素贝叶斯预测客户是否购买汽车新车型主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 构建朴素贝叶斯模型做预测 4.1 构建模型并训练 4.2 阅读全文

posted @ 2022-03-15 17:01 Theext 阅读(193) 评论(0) 推荐(0)

机器学习—分类3-1（KNN算法）

摘要：基于KNN预测客户是否购买汽车新车型主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建KNN模型 4.1 模型1：构建KNN模型并阅读全文

posted @ 2022-03-15 16:58 Theext 阅读(595) 评论(0) 推荐(0)

机器学习—回归2-5（LASSO回归）

摘要：使用LASSO回归根据多个因素预测医疗费用主要步骤流程： 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 标签编码&独热编码 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 构建不同参数的LASSO回归模型 4.1 模型1：构建LASS 阅读全文

posted @ 2022-03-15 16:54 Theext 阅读(851) 评论(0) 推荐(0)

一不小心就进橘子了

橘子种植园

随笔分类 - 数据科学 / 机器学习

公告