摘要:
数据集来源:https://www.kaggle.com/psparks/instacart-market-basket-analysis 思路: 实例代码: 运行结果: 从结果中可以看出数据的维数降到了27 阅读全文
摘要:
数据集的结构:特征值+目标值 (有些可以没有目标值) 数据集:uci kaggle 数据处理工具:pandas sklearn 缺失值 重复值 不需要处理 转换器是一类实现了特征工程的API: 估计器是一类实现了算法的API: 测试代码: 运行结果: 阅读全文
摘要:
监督学习:特征值+目标值非监督学习:特征值 分类:目标值为离散型回归:目标值为连续型 开发流程:类似于数学建模的过程 阅读全文
摘要:
数据降维维度:即特征的数量 数据降维的方法有:1.特征选择 2.主成分分析 特征选择: 代码实例: 运行结果: 主成分分析PCA: 代码实例: 运行结果: 阅读全文