随笔分类 - 统计学习 / 人工智能学院kaggle
摘要:目录加载数据处理缺失数据划分训练集和验证集合并数据集特征工程构建模型定义损失函数模型训练模型优化 加载数据 处理缺失数据 发现只有测试数据的Open有十一个空的(训练数据没有)。由于很少,我们直接将其找出,如下 cond = test['Open'].isnull() test[cond] 输出结果
阅读全文
摘要:目录数据预处理导包查看数据特征工程目标变量特征衍生特征选择信用卡正常消费和盗刷对比交易金额和交易次数信用卡消费时间分析交易金额和交易时间的关系特征分布(非常重要,帮助筛选特征)特征缩放特征重要性模型训练过采样算法建模交叉验证模型评估精确度-召回率曲线ROC曲线各评估指标的对比 数据预处理 导包 除了
阅读全文
摘要:目录导入数据将训练数据与测试数据合并查看数据描述性统计查看是否有异常值查看特征与标签之间的关系查看标签是否有偏态数据预处理填充缺失值特征工程特征创造同组识别筛选子集建模 导入数据 将训练数据与测试数据合并 查看数据 描述性统计查看是否有异常值 看看各个数据是否偏态,最值是否异常 查看特征与标签之间的
阅读全文