摘要: 离群值检测 离群值 outlier:样本中的一个或几个观测值,它们离其他观测值较远,暗示它们可能来自不同的总体。 离群值分类 总体固有变异性的极端表现,这类离群值与样本的其余观测值属于统一总体; 由于试验条件和试验方法的偶然偏离所产生的结果,或产生与观察、记录、计算中的失误,这类离群值与样本中其余观 阅读全文
posted @ 2018-11-29 09:08 琳嘉 阅读(2388) 评论(0) 推荐(0) 编辑
摘要: 数据科学 数据预处理 一、特征编码 数字编码:从0开始赋予特征的每一个取值一个整数。 例子:“收入水平”={0,1,2}来代替“收入水平”={贫困,中等收入,富有} One Hot编码 :将包含K个取值的离散性特征转化为K个二次特征(取值为0,1的特征)。例子:“汽车品牌”={路虎,吉利,奥迪},如 阅读全文
posted @ 2018-11-29 09:03 琳嘉 阅读(347) 评论(0) 推荐(0) 编辑