摘要: ​说起数据清洗,可能会有些小伙伴会觉得这一步可以忽略掉,但是!作为混迹在数据分析这一块多年的老油条,小编在此严肃地声明!资料清理是资料处理中最不能被忽略的部分,它是资料分析过程中不可缺少的一环,其结果的好坏直接关系到模型的效果。实际上,数据清洗通常要占用50%—80%的分析过程。国外有些学术机构还会 阅读全文
posted @ 2022-01-09 16:49 明月说数据 阅读(1261) 评论(0) 推荐(0) 编辑
摘要: ​我们大家都听说过这样的一句话,20%的人掌握着80%的财富,这就是著名的“二八法则”。二八法则指的是最重要的东西只占小部分,约为20%;剩下的80%,虽然是多数但却是次要的。在“二八法则”的基础上,衍生出了一种名为帕累托模型的数据分析方法。我们可以对很多社会或者经济现象进行解释,也可以作为一种数据 阅读全文
posted @ 2022-01-09 15:30 明月说数据 阅读(214) 评论(0) 推荐(0) 编辑