该文被密码保护。 阅读全文
posted @ 2019-01-05 20:47 深夜十二点三十三 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 类别不平衡问题指分类任务中不同类别的训练样本数目差别很大的情况。一般来说,不平衡样本会导致训练模型侧重样本数目较多的类别,而“轻视”样本数目较少类别,这样模型在测试数据上的泛化能力就会受到影响。一个例子,训练集中有99个正例样本,1个负例样本。在不考虑样本不平衡的很多情况下,学习算法会使分类器放弃负 阅读全文
posted @ 2019-01-05 09:19 深夜十二点三十三 阅读(5681) 评论(0) 推荐(0) 编辑
摘要: 从二分类到多分类,实际采用的是拆解法思想:将多分类问题拆分成许多二分类问题,为每一个二分类问题训练一个分类器。测试时,对这些分类器的结果进行集成,得到最终预测结果。 根据拆分策略不同,分为以下三类: 一对一(One vs. One, OvO) 训练:将N个类别两两配对,产生N(N−1)/2个二分类任 阅读全文
posted @ 2019-01-05 00:28 深夜十二点三十三 阅读(1926) 评论(3) 推荐(0) 编辑