为机器学习模型设置最佳阈值:0.5是二元分类的最佳阈值吗

对于二元分类,分类器输出一个实值分数,然后通过对该值进行阈值的区分产生二元的相应。例如,逻辑回归输出一个概率(一个介于0.0和1.0之间的值);得分等于或高于0.5的观察结果产生正输出(许多其他模型默认使用0.5阈值)。

但是使用默认的0.5阈值是不理想的。在本文中,我将展示如何从二元分类器中选择最佳阈值。本文将使用Ploomber并行执行我们的实验,并使用sklearn-evaluation生成图。

这里以训练逻辑回归为例。假设我们正在开发一个内容审核系统,模型标记包含有害内容的帖子(图片、视频等);然后,人工会查看并决定内容是否被删除。

 

完整文章:

https://avoid.overfit.cn/post/951babc49b3e4b4ca66c03c47199708f

posted @ 2022-12-06 09:55  deephub  阅读(67)  评论(0编辑  收藏  举报