摘要: 1.pd.value_count():带入数值可以计算出value有多少的类别 2.sort_values()(按照数值进行排列)/sort_index()(对index/columns的大小进行排列),其中axis=0是默认的值,代表值列 3.reshape():这个是numpy的一个函数,我们可 阅读全文
posted @ 2018-10-21 18:01 yskn 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 一.下采样 对于样本不均衡来说,使得两个样本(向少的样本靠齐)同样的少.将多的数据进行裁剪使得样本最后可以均衡,具体的代码设计如下: 二.过采样 对于样本不均衡来说,使得两个样本(向多的样本靠齐)同样的多(制造多的样本) 阅读全文
posted @ 2018-10-21 17:56 yskn 阅读(393) 评论(0) 推荐(0) 编辑