摘要:
背景 在评分卡建模流程中,WOE(Weight of Evidence)常用于特征变换,IV(Information Value)则用来衡量特征的预测能力。 文章取自:风控模型—WOE与IV指标的深入理解应用 代码取自:特征值筛选依据:IV值和WOE的python计算 WOE和IV的应用价值 WOE 阅读全文
摘要:
## 什么是JSON > JSON: JavaScript Object Notation(JavaScript 对象表示法) > JSON 是存储和交换文本信息的语法,类似 XML。 > JSON 比 XML 更小、更快,更易解析。 > JSON 易于人阅读和编写。 ## JSON 语法规则 JS 阅读全文
摘要:
https://www.runoob.com/python3/python3-json.html 存个坑 周末搞一遍! 该死的bug,😠生气 阅读全文
摘要:
**反思与总结:** 1. 多找角度去核对数据,保证最后结果的准确性 1. 当结果不符合真实意思表示时: * 首先,一定要明确,正确的结果应该是什么,即必须找到一个参照物 * 其次,从粗颗粒度往下或者最细颗粒度往上,定位是哪个维度出现了偏差 * 最后,划定一个较小的数据条目范围,可视化增加某逻辑前后 阅读全文
摘要:
1. 找出连续7天登陆的用户 > 该问题可衍生解决如下常见的业务场景: > 1. 求出**连续**登录7天的用户/用户数 > 2. 求出**连续**充电次数大于等于12次的用户数 > 3. 求出**连续**3年获得冠军的选手 > 4. ...... 步骤1:去重。每个用户每天只保留一次登录记录 `` 阅读全文
摘要:
1. 打开Anaconda Prompt窗口,执行第一个命令,用于安装nbextensions: ``` pip install jupyter_contrib_nbextensions ``` 2. 再执行第二个命令,用于安装 javascript and css files ``` jupyte 阅读全文
摘要:
连续性问题,如: > 1. 求出连续登录7天的用户/用户数 > 2. 求出连续充电次数大于等于12次的用户数 > 3. 求出3年获得冠军的选手 > 4. ...... 通用的解法: 1. 数据去重处理。如求连续7天登录的用户数,则一个用户一天只保留一条数据 2. 开窗函数。找到分区主键,然后按照时间 阅读全文
摘要:
**题目:**有一张用户访问次数表,列名包括用户编号、用户类型、访问量。要求在剔除访问次数前20%的用户后,每类用户的平均访问次数。 **问题拆解:** 1. 访问量前20%数据。 --按照访问量降序排序后,排名小于等于全部用户的20%,即为前20%。(可以类比为年级前几名) ``` select 阅读全文
摘要:
``` dict_data = {'stores' : stores, 'rules': rules, 'm_sku': m_sku, 'mechanisms':mechanisms, 'plants': plants, 'activities': activities, 'sku': sku, ' 阅读全文
摘要:
**问题描述:**比如有一个字段,内容过长,显示的时候不全 **解决方法:** 阅读全文