2018 年 8月 22 日随笔档案 - rgvb178

2018年8月22日

摘要：在机器学习中，我们常常会遇到不均衡的数据集。比如癌症数据集中，癌症样本的数量可能远少于非癌症样本的数量；在银行的信用数据集中，按期还款的客户数量可能远大于违约客户的样本数量。比如非常有名的德国信用数据集，正负样本的分类就不是很均衡：如果不做任何处理简单地进行训练，那么训练结果中（以SVM为例），阅读全文

posted @ 2018-08-22 21:27 rgvb178 阅读(2518) 评论(0) 推荐(0) 编辑

---

公告