摘要: 一、评价分类结果 分类算法的评价:仅仅使用分类准确度可靠吗? 问题:有一个癌症预测系统,输入体检信息,可以判断是否有癌症。预测准确度:99.9%,是好?是坏? 假如癌症产生的概率只有0.1%,我们的系统预测所有人都是健康,即可达到99.9的准度率! 因此对于极度偏斜(Skewed Data)的数据, 阅读全文
posted @ 2022-05-05 18:43 aggressive2019 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 1.创建表(movie,category,m_category) create table movie ( id int primary key auto_increment, name varchar(20), movie_info varchar(100)); insert into movie 阅读全文
posted @ 2021-03-05 16:13 aggressive2019 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 假设检验:(原假设符合该分布,备择假设不符合该分部) 1)建立原假设H0(包含等号),H0的反命题为H1,也叫备择假设 2)选择检验统计量(根据均值,方差等性质构造的一个转换函数) 3)根据显著水平(一般为0.05),确定拒绝域 4)计算p值或样本统计值,做出判断 阅读全文
posted @ 2020-12-15 17:01 aggressive2019 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 申请将博客搬至CSDN,谢谢 阅读全文
posted @ 2020-11-12 16:04 aggressive2019 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 一、切换到root用户su - root 二、关闭selinux:vim /etc/selinux/configSELINUX=disabled 三、切换到hadoop用户,配置免密登陆。cd 进入hadoop用户的家目录ssh-keygen -t rsa [输入完后连按4个回车]ssh node1 阅读全文
posted @ 2020-10-29 13:47 aggressive2019 阅读(88) 评论(0) 推荐(0) 编辑
摘要: 欺诈与反欺诈 一、 互联网面临的欺诈风险 欺诈三要素:欺诈人,欺诈目的,欺诈手段,是否定义为欺诈要看企业业务或者产品的需要 欺诈的类型:个人欺诈,团体欺诈或者(第一方欺诈、第二方欺诈、第三方欺诈),欺诈目的有盗刷、薅羊毛、骗贷、套现、刷单、刷好评 欺诈的表现形式: 网络攻击(撞库、拖库、洗库),机器 阅读全文
posted @ 2020-10-17 18:36 aggressive2019 阅读(1764) 评论(0) 推荐(0) 编辑
摘要: 政策与定价 1.不同应用场景下量化风控政策设定 市场主流产品 无定向用途贷款(信用贷款);2.定向用途贷款(商品贷款) 无定向用途贷款申请流程: 进件 审核 审核结果/授信 贷后管理 政策制定关注点: 用户准入设计,排除高危用户后的目标客群; 数据准入设计,必填项的要求与考量; 个人信息验证,包括人 阅读全文
posted @ 2020-09-01 15:01 aggressive2019 阅读(933) 评论(2) 推荐(0) 编辑
摘要: 组合模型在信贷风控中的应用 简介:在包括违约预测在内的诸多场景中,越来越多的建模人员将模型集成的方式应用在实际工作中,并且取得了不错的成效。本节课将介绍三种基本的集成方式:Bagging,boosting,stacking。 目录: 1.元模型与集成模型 2.多模型的bagging 3.多模型的boosting 4.多模型的stacking 1.元模型与集成模型 什么是集成模型:把多种单一问题组合... 阅读全文
posted @ 2020-05-31 09:18 aggressive2019 阅读(443) 评论(0) 推荐(0) 编辑
摘要: 模型的验证、监控与调优 简介:得到评分卡模型后,还需要验证模型的性能。并且部署后还要持续监测模型的表现。 目录: 模型的区分度 模型的预测性与混淆矩阵 模型的平稳性 模型的调优 模型的区分度 区分度的概念 评分模型的作用是通过分数将好坏人群进行区分。从分数的性质可以看出,好的评分模型下违约人群的分数低、非违约人群的分数高。反之坏的评分模型下违约与非违约人群的分数是几乎无法区分的。在理想模型里,所有... 阅读全文
posted @ 2020-05-27 16:40 aggressive2019 阅读(1029) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归模型在评分卡开发中的应用 课程简介:在分类场景中,逻辑回归模型是常用的一类算法。它具有结构简单、可解释性强、输出结果是"软分类"的特点。评分模型多采用这类算法。同时逻辑回归模型也面临一些限制,因此在特征工程阶段我们对输入特征做了相应的调整和约束。 目录: 逻辑回归模型的基本概念 基于逻辑回归模型的评分卡构建工作 尺度化 1. 逻辑回归模型的基本概念 伯努利概型 在分类模型中,目标变量是离散... 阅读全文
posted @ 2020-05-26 16:13 aggressive2019 阅读(1175) 评论(0) 推荐(0) 编辑