随笔分类 - 互联网金融
摘要:一般银行的数据库是oracle,互联网企业用mysql 因此对于mysql,就可以通过python接口pymysql操作,本质上还是sql语言操作数据库,只是python再去拿结果分析 pymysql操作简介 连接数据库得到表 cursor获得操作句柄 cursor.execute("sql语句")
阅读全文
摘要:1. 编码之后的数值,不仅代表此特征取值,还代表了对于标签属性的影响权重 2. WOE编码将非线性特征转化成对于标签来说的线性特征,更契合广义线性模型。
阅读全文
摘要:2010-2020 互金发展的飞速十年,带来的问题 * p2p暴雷(伪标的) * 校园裸贷 * 用户隐私泄露 * 暴力催收 * 线上高利贷 消金发展的好处: 扩大消费,拉动内需 金融业务: 银行理财 保险 证券 基金 消金 供应链金融:数据难采集,信用体系发展缓慢 支付业务 国家监管政策: 持牌与合
阅读全文
摘要:纵坐标:真正例率 正样本被正确召回的比例 横坐标:假正例率(分子是预测为正实际为反,分母是负样本) 负样本被错误找回的比例 因此在ROC曲线的面积AUC,可以理解为是固定FPR,正样本的正确召回率;或者固定TPR,负样本的正确召回率。(样本预测的排序质量) 因此AUC越大越好。 显然,我们关注的是模
阅读全文