R语言 实验三 数据探索和预处理

 

计算缺失值个数

计算缺失率

 

 

简单统计量:计算最值

 

 

 

箱形图分析

 

 

 

分布分析:画出频率直方图

 

 

统计量分析:对于连续属性值,求出均值以及标准差

 

 

       

缺失值处理:删除法

 

 

 

去除无用属性:删除“ID”属性

或者

 

 

 

离散化:把“Children”属性转换成分类型的两个值“YES”“NO”;把income属性按照节点12640.317390.12962243228.2离散化。

 

 

 

 

 

 

 

posted on 2018-10-25 00:13  蔡军帅  阅读(962)  评论(0编辑  收藏  举报