摘要: 前些日子回头重温了一下git,结果惊讶地发现又全部给我忘光了。 因寻思整理一下笔记,以便日后快速重温,我可不想老是浪费时间再重复学习上。 作为一篇以重温为目的的笔记,自然是清晰简短最好,所以如果你没有一点git的基础,就不用看此篇了。 阅读全文
posted @ 2018-09-04 16:39 WoLykos 阅读(142) 评论(0) 推荐(0) 编辑
摘要: woe全称是“Weight of Evidence”,即证据权重,是对原始自变量的一种编码形式。 进行WOE编码前,需要先把这个变量进行分组处理(离散化) 其中,pyi是这个组中响应客户(即模型中预测变量取值为“是”或1的个体,也叫坏样本)占所有样本中所有响应客户的比例,pni是这个组中未响应客户( 阅读全文
posted @ 2018-09-04 15:35 WoLykos 阅读(3673) 评论(0) 推荐(0) 编辑
摘要: 一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema=None, index_col=None, coerce_float=True, columns=None) pandas.read_sql_query(sql, 阅读全文
posted @ 2018-09-04 10:22 WoLykos 阅读(1879) 评论(0) 推荐(0) 编辑