2021年1月24日

摘要: 1.测试集验证集合 library(ggplot2) library(caret) seed(123456) 设置随机数种子 prop.table(table(xxx字段) index<-createDataParatition xunlianji<- credit[index,] ceshiji< 阅读全文
posted @ 2021-01-24 21:08 jude_liu 阅读(508) 评论(0) 推荐(0) 编辑
 
摘要: 1. summary 、str、names、table -》 大体数据 2. mean、sum 、complete.cases、aggr(xxx,prop=false,numbers=true) -》 缺失值 引用: library(lattice) library(grid) library(mi 阅读全文
posted @ 2021-01-24 19:55 jude_liu 阅读(454) 评论(0) 推荐(0) 编辑
 
摘要: 1.(IV 信息量 )在用逻辑回归模型方法构建分类模型时候,需要对自变量进行筛选 使用信息量 IV , 来衡量自变量的预测能力。 信息量越大 预测能力越强,就越应该放入 模型中。 2.(WOE值)是 IV值的基础。 即 证据权重 Weight of Evidence. WOE 是对原始自变量的一种编 阅读全文
posted @ 2021-01-24 19:30 jude_liu 阅读(1011) 评论(0) 推荐(0) 编辑
 
摘要: 发现一个数学 极其有趣的网站:https://www.mathwarehouse.com/ 1、椭圆的画法 (怎么画椭圆?) 2、杨辉三角问题(Pascal triangles)解法 3、使用“FOIL”轻松的解决二项式乘法 4、对数解法技巧 5、矩阵转置的技巧 6、勾股定理 7、多边形的外角之和总 阅读全文
posted @ 2021-01-24 17:39 jude_liu 阅读(221) 评论(0) 推荐(0) 编辑
 
摘要: 极大似然估计参数估计的四个步骤 (1) 写出似然函数; (2) 对似然函数取对数,并整理; (3) 求导数 ; (4) 解似然方程 。 极大似然估计的概念 极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就 阅读全文
posted @ 2021-01-24 16:44 jude_liu 阅读(3727) 评论(0) 推荐(0) 编辑