摘要: 数据集来源:https://www.kaggle.com/psparks/instacart-market-basket-analysis 思路: 实例代码: 运行结果: 从结果中可以看出数据的维数降到了27 阅读全文
posted @ 2018-12-24 23:55 wydxry 阅读(874) 评论(0) 推荐(0) 编辑
摘要: 数据集的结构:特征值+目标值 (有些可以没有目标值) 数据集:uci kaggle 数据处理工具:pandas sklearn 缺失值 重复值 不需要处理 转换器是一类实现了特征工程的API: 估计器是一类实现了算法的API: 测试代码: 运行结果: 阅读全文
posted @ 2018-12-24 20:49 wydxry 阅读(379) 评论(0) 推荐(0) 编辑
摘要: 监督学习:特征值+目标值非监督学习:特征值 分类:目标值为离散型回归:目标值为连续型 开发流程:类似于数学建模的过程 阅读全文
posted @ 2018-12-24 17:49 wydxry 阅读(851) 评论(0) 推荐(0) 编辑
摘要: 数据降维维度:即特征的数量 数据降维的方法有:1.特征选择 2.主成分分析 特征选择: 代码实例: 运行结果: 主成分分析PCA: 代码实例: 运行结果: 阅读全文
posted @ 2018-12-24 16:53 wydxry 阅读(1715) 评论(0) 推荐(0) 编辑
Live2D