摘要: 以单层决策树作为弱学习器构建AdaBoost分类器。非均衡分类问题可以通过ROC曲线调整阈值、代价函数以及欠抽样、过抽样的方法解决。 阅读全文
posted @ 2017-06-29 20:30 戴戴Day 阅读(1639) 评论(0) 推荐(0) 编辑
摘要: SVM通过求解一个二次优化问题来最大化分类间隔。 SMO算法通过每次只优化2个alpha值来加快SVM的训练速度。 kernel将数据从一个低维空间映射到一个高维空间,将低维空间中的非线性问题转换成高维空间中的线性问题。 阅读全文
posted @ 2017-06-29 20:26 戴戴Day 阅读(1308) 评论(1) 推荐(0) 编辑
摘要: 基于最优化方法确定最佳回归系数,任何大于0.5的数据被分为1类,小于0.5即被归为0类,所以,Logistic回归也可以被看成是一种概率估计。 阅读全文
posted @ 2017-06-29 20:23 戴戴Day 阅读(798) 评论(0) 推荐(0) 编辑
摘要: 优点:在数据较少的情况下依然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 阅读全文
posted @ 2017-06-29 20:16 戴戴Day 阅读(544) 评论(0) 推荐(0) 编辑