- resampling
- over sampling
- random over sampling
- generate synthetic examples: SMOTE(synthetic minority oversampling technique) by a neareast neighbors approach

- under sampling
- random under sampling
- Tomek links
- model-level methods
- use class-banlaned loss(类别不平衡损失函数.pdf)
- 加权交叉熵
- Focal Loss
- CB Loss:可以不用关注推导,就是增加一个加权重因子(1−β)/(1−βni)(又称为类别平衡项)到损失函数中,其中超参数β∈(0,1),ni是类i的样本数量,达到的效果就是递减样本数多的那些类在loss上因为样本数多而产生的边际效益,如图

类平衡项(1−β)/(1−βny)与模型和损失无关的, 在某种意义上,与损失函数L和预测得到的类概率p是相对独立的,可以应用到各种损失函数上。

- select appropriate algorithms
- tree-based models
- Logistic regression: adjust the probability threshold
- combine multiple algorithms
- under-sampling + ensemble

- under-sampling + class-banlaned loss
- evaluation metrics
- Precision, recall, F1
- Precision-Recall curve
- AUC of the ROC curve
posted @
2024-12-13 11:02
singyoutosleep
阅读(
176)
评论()
编辑
收藏
举报
点击右上角即可分享
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 通过 API 将Deepseek响应流式内容输出到前端
· AI Agent开发,如何调用三方的API Function,是通过提示词来发起调用的吗