摘要:
所谓不平衡指的是:不同类别的样本数量差异非常大。 数据规模上可以分为大数据分布不均衡和小数据分布不均衡。大数据分布不均衡:例如拥有1000万条记录的数据集中,其中占比50万条的少数分类样本便于属于这种情况。小数据分布不均衡:例如拥有1000条数据样本的数据集中,其中占有10条的少数分类样本便于属于这 阅读全文
摘要:
1. groupby() 2. 聚合方法size()和count() size跟count的区别: size计数时包含NaN值,而count不包含NaN值 count() size() 来自:https://blog.csdn.net/m0_37870649/article/details/8097 阅读全文