摘要: %matplotlib inline %matplotlib inline这一句是IPython的魔法函数,使用%matplotlib命令可以将matplotlib的图表直接嵌入到Notebook之中,省略掉plt.show()这一步,直接显示图像。 %config InlineBackend.fi 阅读全文
posted @ 2019-09-24 14:14 蔓越煤 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 1. pandas的核心或基础知识点: pandas的核心结构是DataFrame,它是由多个series组合而成(Series类型由一组数据及与之相关的数据索引组成),而实际值的核心结果是ndarray,故pandas是基于numpy的一种工具。 2. 各种基础函数的使用: pd.read_csv 阅读全文
posted @ 2019-09-24 14:13 蔓越煤 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 评分卡建模的基本流程: IV值的区分度情况: 模型效果评估: PSI稳定性的评估, 0.2已经很不稳定了 阅读全文
posted @ 2019-09-09 15:55 蔓越煤 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 关联规则挖掘的目的是在数据项目中找出所有的并发关系,除了基本Aprioris算法,还有一些常用的改进算法,例如多最小支持度的关联规则挖掘,分类关联规则挖掘。 支持度:规则前项LHS和规则后项RHS所包括的商品都同时出现的概率,LHS和RHS商品的交易次数/总交易次数。 置信度:在所有的购买了左边商品 阅读全文
posted @ 2019-09-09 15:48 蔓越煤 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 聚类分析:是研究样本或指标进行分类的一种多元统计方法。 聚类分析按根据分类对象的不同分为R型和Q型,R型对变量进行分类,Q型对样品进行分类。 常用的聚类方法:系统聚类法、模糊聚类法(多为定性变量的分类)、K 均值法(动态聚类法)、有序样品的聚类(最优分割法)、分解法、加入法等 定量数据在进行聚类分析 阅读全文
posted @ 2019-09-09 15:47 蔓越煤 阅读(1001) 评论(0) 推荐(0) 编辑
摘要: Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项,多项分类的资料。 1)logistic回归的作用: 预测预报:通过模型可以预测发病、死亡等的概 因素分析:寻找对发病、死亡等影响有显著性的因素 2)Lo 阅读全文
posted @ 2019-09-09 15:30 蔓越煤 阅读(380) 评论(0) 推荐(0) 编辑
摘要: [TOC] 1. 标题设置 在想要设置为标题的文字前面加“ ”来表示,一个 是一级标题,二个 是二级标题,以此类推。注:标准语法一般在 后跟个空格再写文字 示例和效果: 2. 字体设置 加粗 要加粗的文字左右分别用“\ \ ”包起来[该处\为转义字符] 示例: 效果: 加粗 倾斜 要倾斜的文字左右分 阅读全文
posted @ 2019-08-28 09:42 蔓越煤 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 报表相关: 1、借款报表:按照时间维度(日、月、累计借款,客单价、笔单价、平均期数),分期数、品类、用户类型(普通用户、白名单用户、黑名单用户)、新老用户(定义?) 2、风控报表:强风控、弱风控(整体通过率[转化率]、细化各个规则通过率、规则不交叉命中率、规则缺失率) 3、额度报表:每日获得额度情况 阅读全文
posted @ 2019-08-28 09:21 蔓越煤 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 1. numpy的核心或基础知识点: NumPy是一个Python包,它是一个由多维数组对象和用于处理数组的例程集合组成的库,其核心结构是ndarray。 2. 各种基础函数的使用 np.array(object, dtype=None, copy=True, order='K', subok=Fa 阅读全文
posted @ 2019-08-28 09:14 蔓越煤 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 对“bill_ids”字段按逗号分隔形成多条数据 SELECT a.id, substring_index(substring_index(a.bill_ids, ',', b.id), ',', -1) bill_ids, a.status, a.card_name FROM (SELECT id 阅读全文
posted @ 2019-07-06 19:13 蔓越煤 阅读(289) 评论(0) 推荐(0) 编辑