上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 39 下一页
  2020年9月18日
摘要: set_index DataFrame可以通过set_index方法,可以使用现有列设置单索引和复合索引 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 参数: key 阅读全文
posted @ 2020-09-18 14:38 小小喽啰 阅读(8882) 评论(0) 推荐(0) 编辑
摘要: rename方法作用: 复制 DataFrame并对其索引index和列标签columns进行赋值。如果希望就地修改某个数据集,传入inplace=True即可 DataFrame.rename(**kwargs) 参数: mapper:dict-like or function,这个字段我也不是很 阅读全文
posted @ 2020-09-18 10:37 小小喽啰 阅读(14377) 评论(0) 推荐(1) 编辑
  2020年9月14日
摘要: 数据地址:https://tianchi.aliyun.com/competition/entrance/531830/information 1.导入模块和数据 import pandas as pd import numpy as np import matplotlib.pyplot as p 阅读全文
posted @ 2020-09-14 17:20 小小喽啰 阅读(443) 评论(0) 推荐(0) 编辑
摘要: sklearn.feature_selection.SelectKBest 根据某中检验方法,比如chi2 啦,选择k个最高分数的特征,属于单变量特征选择的一种,可以看做是一个估计器的预处理步骤 官网地址:https://scikit-learn.org/stable/modules/generat 阅读全文
posted @ 2020-09-14 14:48 小小喽啰 阅读(1852) 评论(0) 推荐(0) 编辑
  2020年9月11日
摘要: 模型融合 5.1 学习目标 将之前建模调参的结果进行模型融合。 尝试多种融合方案,提交融合结果并打卡。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程) 5.2 内容介绍 模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差 阅读全文
posted @ 2020-09-11 17:52 小小喽啰 阅读(822) 评论(3) 推荐(0) 编辑
摘要: 建模与调参 4.1 学习目标 学习在金融分控领域常用的机器学习模型 学习机器学习模型的建模过程与调参流程 4.2 内容介绍 逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模 阅读全文
posted @ 2020-09-11 17:37 小小喽啰 阅读(1348) 评论(0) 推荐(0) 编辑
摘要: 特征工程 项目地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl 3.1 学习目标 学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法 学习特征交互、编 阅读全文
posted @ 2020-09-11 16:15 小小喽啰 阅读(1827) 评论(0) 推荐(0) 编辑
摘要: 一、赛题数据 数据大家可以到官网去下载:https://tianchi.aliyun.com/competition/entrance/531830/information需要报名后才可以下载数据 赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超 阅读全文
posted @ 2020-09-11 15:21 小小喽啰 阅读(3307) 评论(0) 推荐(0) 编辑
  2020年9月10日
摘要: 2021.3.11补充: 官网地址:https://xgboost.readthedocs.io/en/latest/python/python_api.html DMatrix 是XGBoost中使用的数据矩阵。DMatrix是XGBoost使用的内部数据结构,它针对内存效率和训练速度进行了优化 阅读全文
posted @ 2020-09-10 17:02 小小喽啰 阅读(3840) 评论(0) 推荐(0) 编辑
摘要: 目录 一、XGBoost原理 1.1. 学习目标 1.2. 节点的划分 1.2.1 基本精确的贪心算法(Basic Exact Greedy Algorithm) 1.2.2 近似算法 1.2.3 带权重的分位数草图(Weighted Quantile Sketch) 二. XGBoost的优缺点: 阅读全文
posted @ 2020-09-10 14:59 小小喽啰 阅读(1733) 评论(0) 推荐(2) 编辑
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 39 下一页