会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lvzw
博客园
首页
新随笔
联系
订阅
管理
某保险公司参保客户分析
Table of Contents
¶
1 读取数据
2 了解数据
2.1 统计一下每一列中有多少空值
2.2 查看数据中是否有重复值
2.3 可视化数据查看数据分布
2.3.1 看一下目标变量是否平衡
2.3.2 绘制年龄分布情况
2.3.3 两类样本的年龄分布
2.3.4 学历情况
2.3.5 查看不同的学历之间是否购买保险的人数
2.3.6 不同的县级别是否购买保险的人数
2.4 数据处理
2.4.1 空值填充
2.4.2 变量编码
2.5 建模
2.5.1 尝试使用最小叶节点样本数量和最小分割样本数量进行调参
2.5.2 对数据进行PCA压缩
详情链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/保险行业案例分析.ipynb
posted @
2019-09-28 11:30
lvzw
阅读(
178
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部
公告