8.2.py 知识图谱
摘要:该章节涉及到知识图谱的知识,我们先说几个概念 1.节点和边 节点就是现实世界存在的实体,边就是实体和实体之间的关系 2.权重 权重通常用与衡量关系的强弱,权重越大,比如说用户A给用户B打了15个电话,则权重为15 3.有向图无向图 根据边是否有方向,分为有向图和无向图,比如说用户A给用户B打了15个
阅读全文
posted @
2021-10-09 11:47
小小喽啰
阅读(695)
推荐(0) 编辑
7.2.py 树模型衍生变量
摘要:主要是通过树模型衍生变量。然后和逻辑回归模型融合在一起;树模型LGM衍生模型,主要是使用LGM模型对原始数据进行训练,把每个样本落在的叶节点的位置记为1,这个有N个树就有N个位置,然后每个样本就得到一个1xN(N是树的棵树)的向量,然后通过PSI,特征重要性去刷选变量,最后将刷选后的变量放入逻辑回归
阅读全文
posted @
2021-10-08 15:31
小小喽啰
阅读(356)
推荐(0) 编辑
3.3.py 迁移学习
摘要:本章节主要说的迁移学习的事情,迁移学习简单来说:举个例子,新产品上线,建模使用其他产品和少量新产品的数据建模,不码字,具体百度吧。 全部代码: # -*- coding: utf-8 -*- """ Created on Tue Dec 24 15:25:58 2019 @author: zixin
阅读全文
posted @
2021-09-30 18:09
小小喽啰
阅读(266)
推荐(0) 编辑
1.3.py CART回归树做组合规则特征
摘要:本次章节的2个疑点: 1.决策树是不需要处理缺失值得,梅老师也乜有处理缺失值,tree.DecisionTreeRegressor在梅老师那里是运行成功的,但是我的报错ValueError: Input contains NaN, infinity or a value too large for
阅读全文
posted @
2021-09-29 15:12
小小喽啰
阅读(230)
推荐(0) 编辑
2.7.py xgboost版评分映射
摘要:主要修改点有2处: 1.xgboost的参数,有些参数现版本的xgboost是没有的,需要注释掉或者使用现在的替换 2.xgboost版评分映射的问题,由于预测的是逾期的概率,因此我们需要使用基础分-后面的,而不是+ #%% import pandas as pd from sklearn.metr
阅读全文
posted @
2021-09-29 10:44
小小喽啰
阅读(644)
推荐(0) 编辑