摘要: 缺失值是指数据集中的某些观测存在遗漏的指标值,缺失值的存在同样会影响到数据分析和挖掘的结果。 一般而言,当遇到缺失值是可以采三种方法处置:删除法,替换法和插补法。 1.删除法使用情况:当确实的观测比例非常低是,如5%以内,可以直接删除这些缺失的变量。 2.替换法:用某种直接替换缺失值,例如,对连续变 阅读全文
posted @ 2019-11-27 10:48 另一个起点 阅读(1540) 评论(0) 推荐(0) 编辑
摘要: 当在处理正则表达式的时候,除了正则表达式对象之外,还有另一个对象类型:匹配对象,即是成功调用match()或者search()所返回的对象。 匹配对象有两个主要方法:group() 和 groups() 。 group():要么返回整个匹配对象,要么根据要求返回特定子组;如果group()没有子组要 阅读全文
posted @ 2019-11-27 09:25 另一个起点 阅读(655) 评论(0) 推荐(0) 编辑