摘要: 所谓不平衡指的是:不同类别的样本数量差异非常大。 数据规模上可以分为大数据分布不均衡和小数据分布不均衡。大数据分布不均衡:例如拥有1000万条记录的数据集中,其中占比50万条的少数分类样本便于属于这种情况。小数据分布不均衡:例如拥有1000条数据样本的数据集中,其中占有10条的少数分类样本便于属于这 阅读全文
posted @ 2019-07-08 21:42 做梦当财神 阅读(8225) 评论(0) 推荐(1) 编辑
摘要: 1. groupby() 2. 聚合方法size()和count() size跟count的区别: size计数时包含NaN值,而count不包含NaN值 count() size() 来自:https://blog.csdn.net/m0_37870649/article/details/8097 阅读全文
posted @ 2019-07-08 19:59 做梦当财神 阅读(12518) 评论(0) 推荐(0) 编辑