摘要: 1.什么是ROC: ROC曲线:接收者操作特征曲线(receiver operating characteristic curve),是反映敏感性和特异性连续变量的综合指标,roc曲线上每个点反映着对同一信号刺激的感受性。 2.如果学习ROC,首先必须知道什么: 要学习ROC曲线首先得知道什么是TP 阅读全文
posted @ 2022-01-02 21:50 常给自己加个油 阅读(2239) 评论(0) 推荐(1) 编辑
摘要: 在集成学习之Adaboost算法原理小结中,我们对Adaboost的算法原理做了一个总结。这里我们就从实用的角度对scikit-learn中Adaboost类库的使用做一个小结,重点对调参的注意事项做一个总结。 1. Adaboost类库概述 scikit-learn中Adaboost类库比较直接, 阅读全文
posted @ 2022-01-02 18:46 常给自己加个油 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 相关文章: 数据挖掘领域十大经典算法之—C4.5算法(超详细附代码)数据挖掘领域十大经典算法之—K-Means算法(超详细附代码)数据挖掘领域十大经典算法之—SVM算法(超详细附代码)数据挖掘领域十大经典算法之—Apriori算法数据挖掘领域十大经典算法之—EM算法数据挖掘领域十大经典算法之—Pag 阅读全文
posted @ 2022-01-02 12:13 常给自己加个油 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 摘自数据常青藤 样本分布不均衡将导致样本量少的分类所包含的特征过少,并很难从中提取规律;即使得到分类模型,也容易产生过度依赖于有限的数据样本而导致过拟合的问题,当模型应用到新的数据上时,模型的准确性和鲁棒性将很差。 样本分布不平衡主要在于不同类别间的样本比例差异,以笔者的工作经验看,如果不同分类间的 阅读全文
posted @ 2022-01-02 12:10 常给自己加个油 阅读(1009) 评论(0) 推荐(0) 编辑