摘要: 背景 在评分卡建模流程中,WOE(Weight of Evidence)常用于特征变换,IV(Information Value)则用来衡量特征的预测能力。 文章取自:风控模型—WOE与IV指标的深入理解应用 代码取自:特征值筛选依据:IV值和WOE的python计算 WOE和IV的应用价值 WOE 阅读全文
posted @ 2023-10-07 23:37 ttttttian 阅读(241) 评论(0) 推荐(0) 编辑
摘要: ## 什么是JSON > JSON: JavaScript Object Notation(JavaScript 对象表示法) > JSON 是存储和交换文本信息的语法,类似 XML。 > JSON 比 XML 更小、更快,更易解析。 > JSON 易于人阅读和编写。 ## JSON 语法规则 JS 阅读全文
posted @ 2023-08-20 17:10 ttttttian 阅读(3) 评论(0) 推荐(0) 编辑
摘要: https://www.runoob.com/python3/python3-json.html 存个坑 周末搞一遍! 该死的bug,😠生气 阅读全文
posted @ 2023-08-01 10:39 ttttttian 阅读(4) 评论(0) 推荐(0) 编辑
摘要: **反思与总结:** 1. 多找角度去核对数据,保证最后结果的准确性 1. 当结果不符合真实意思表示时: * 首先,一定要明确,正确的结果应该是什么,即必须找到一个参照物 * 其次,从粗颗粒度往下或者最细颗粒度往上,定位是哪个维度出现了偏差 * 最后,划定一个较小的数据条目范围,可视化增加某逻辑前后 阅读全文
posted @ 2023-07-27 15:16 ttttttian 阅读(72) 评论(0) 推荐(0) 编辑
摘要: 1. 找出连续7天登陆的用户 > 该问题可衍生解决如下常见的业务场景: > 1. 求出**连续**登录7天的用户/用户数 > 2. 求出**连续**充电次数大于等于12次的用户数 > 3. 求出**连续**3年获得冠军的选手 > 4. ...... 步骤1:去重。每个用户每天只保留一次登录记录 `` 阅读全文
posted @ 2023-07-27 13:51 ttttttian 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 1. 打开Anaconda Prompt窗口,执行第一个命令,用于安装nbextensions: ``` pip install jupyter_contrib_nbextensions ``` 2. 再执行第二个命令,用于安装 javascript and css files ``` jupyte 阅读全文
posted @ 2023-07-22 14:48 ttttttian 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 连续性问题,如: > 1. 求出连续登录7天的用户/用户数 > 2. 求出连续充电次数大于等于12次的用户数 > 3. 求出3年获得冠军的选手 > 4. ...... 通用的解法: 1. 数据去重处理。如求连续7天登录的用户数,则一个用户一天只保留一条数据 2. 开窗函数。找到分区主键,然后按照时间 阅读全文
posted @ 2023-07-20 19:20 ttttttian 阅读(1031) 评论(0) 推荐(0) 编辑
摘要: **题目:**有一张用户访问次数表,列名包括用户编号、用户类型、访问量。要求在剔除访问次数前20%的用户后,每类用户的平均访问次数。 **问题拆解:** 1. 访问量前20%数据。 --按照访问量降序排序后,排名小于等于全部用户的20%,即为前20%。(可以类比为年级前几名) ``` select 阅读全文
posted @ 2023-07-20 16:51 ttttttian 阅读(584) 评论(0) 推荐(0) 编辑
摘要: ``` dict_data = {'stores' : stores, 'rules': rules, 'm_sku': m_sku, 'mechanisms':mechanisms, 'plants': plants, 'activities': activities, 'sku': sku, ' 阅读全文
posted @ 2023-07-20 13:37 ttttttian 阅读(8) 评论(0) 推荐(0) 编辑
摘要: **问题描述:**比如有一个字段,内容过长,显示的时候不全 **解决方法:** 阅读全文
posted @ 2023-07-20 11:26 ttttttian 阅读(24) 评论(0) 推荐(0) 编辑