摘要: 目录 一、模型介绍 二、参数详解 三、实战 1、使用前文的数据(ps:含catboost相关参数解释) 2、catboost建模 3、ngboost建模 精华部分 NGBoost是继xgboost、lightGBM、catboost之后boosting家族的新成员,拥有更高的精度、但是由于计算复杂度 阅读全文
posted @ 2023-08-24 10:00 ds风控 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 目录 一 主要特点: 1 类别变量编码-Order Target Statistics方法 2 文本型变量编码处理 3 类别型特征交叉-FM 4 无偏提升-Ordered Boosting 5 使用对称树作为基模型,加速运行 6 不一样的缺失值处理 二 原理详解 1 类别变量处理-Order Tar 阅读全文
posted @ 2023-08-07 09:56 ds风控 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 目录 一、交叉验证 二、网格搜索 三、贝叶斯优化 建模的整个过程中最耗时的部分是特征工程(含变量分析),其次可能是调参,所以今天来通过代码实战介绍调参的相关方法:网格搜索、贝叶斯调参。 一、交叉验证 工作中最常用的训练集测试集划分方法主要是随机比例分割和(分层)交叉验证,随机比例分割可以按照7-3、 阅读全文
posted @ 2023-08-01 18:41 ds风控 阅读(330) 评论(0) 推荐(0) 编辑
摘要: 早在几年前动态可交互的图表已经流行,在各公司前台、大厅都展示着漂亮的可视化大屏,本文简单介绍一个简单好用的动态可交互图表工具-pyecharts,并使用pyecharts制作一个简单的图表大屏,先附上部分动图效果: gif动图 附上pyecharts官网链接:Document 由于官网基本demo图 阅读全文
posted @ 2023-06-20 20:47 ds风控 阅读(354) 评论(0) 推荐(0) 编辑
摘要: 目录 导包 决策树可视化方法 xgb、lgb建模 xgb可视化 lgb可视化 导包 from sklearn.datasets import load_iris from sklearn.tree import plot_tree from sklearn import tree from skle 阅读全文
posted @ 2023-01-26 23:30 ds风控 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 目录 一、文本分类 1、导包 2、数据读取+预处理 3、导入英文停用词 4、构建部分统计特征 5、文本预处理 6、划分训练、测试集 7、构建tf-idf特征 8、建模函数 9、特征分组+lgb模型构建 二、划重点 少走10年弯路 一、文本分类 1、导包 import re import os fro 阅读全文
posted @ 2022-12-01 12:36 ds风控 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 目录 一、原理 二、实战 sklearn中提供的文本处理方法 1、导包 2、初始化词频向量/tf_idf的训练参数 3、CountVectorizer训练及应用函数 4、CountVectorizer使用 5、TfidfTransformer训练及应用函数 6、TfidfTransformer训练及 阅读全文
posted @ 2022-09-05 17:33 ds风控 阅读(451) 评论(0) 推荐(0) 编辑
摘要: 写在开头,关注公众号:Python风控模型与数据分析、回复 风控实战1 ,即可获取本文数据集及完整代码,以及更多理论知识与代码分享 目录 1、导包 2、数据读取 3、统计分析 3.1 样本分布 3.2 特征缺失统计 3.3 数据类型分布 3.4 数据清洗 3.5 类别型变量单变量分析 3.6 特征衍 阅读全文
posted @ 2022-07-29 16:23 ds风控 阅读(59) 评论(0) 推荐(0) 编辑
摘要: 一、模型训练过程 贪心优化算法。多颗决策树串行训练,第一棵树拟合训练目标、第二颗树拟合前面的残差、第三棵树拟合前两棵树留下的残差。 1、残差来源: (1)第k颗树训练时,行采样+列采样(即仅有部分样本、部分特征进入树中进行训练)进入树,决策树按照最大信息增益原则选择分裂特征、分裂点进行分裂; (2) 阅读全文
posted @ 2022-07-19 09:49 ds风控 阅读(111) 评论(0) 推荐(0) 编辑
摘要: xgb作为常用的集成模型,不仅是当前工业落地最常用的模型之一、而且几乎是风控面试的必考点,从gbdt到xgboost,有一个重要的新增特性就是模型可自行处理缺失值,减少我们在预处理过程中的工作量、不需要再进行缺失填充,极大地简化了我们建模流程。 那么xgb在训练和预测时是如何处理缺失值的呢? 先来看 阅读全文
posted @ 2022-07-10 00:35 ds风控 阅读(193) 评论(0) 推荐(0) 编辑