摘要: 实际使用分类器的时候,经常遇到分类样本不均衡的问题。而只有分类样本较为均衡,才可以达到比较好的分类效果。 1、如果各个类别的样本数量都非常多,则对于样本少的类,使用全部样本。 而对于样本多的类,进行采样。采样可以随机采样,或者如果有某一类别里,有一部分数据非常接近,比如奈雪的茶、koi在茶饮里占了几 阅读全文
posted @ 2019-04-10 15:43 yjy888 阅读(483) 评论(0) 推荐(0) 编辑
摘要: Way:from tqdm import tqdmimport pandas as pdtqdm.pandas(desc='pandas bar')df['title_content'] = df.progress_apply(lambda x: _title_content(x['title'], 阅读全文
posted @ 2019-04-10 14:32 yjy888 阅读(3351) 评论(0) 推荐(0) 编辑