随笔分类 -  数据建模笔记

摘要:描述 本文归纳数据清洗后到建模前的工作内容。随着阅读量和工作经验的增加慢慢扩充积累 在数据清洗结束后,要着手分析各项特征,进行筛选建模。特征的分析和筛选是建模工作中最繁杂、工作量最高的环节。 在sklearn的apifeature_selection中有很多通识方法,此外在部分模型如随机森林中集成有 阅读全文
posted @ 2022-02-21 23:05 菲克纽斯 阅读(1109) 评论(0) 推荐(0) 编辑
摘要:准确率和召回率 本来我开始以为准确率召回率这种东西不用记得太详细,用到的时候随手百度一下就行。但尝试搜了几篇文章评论区都有指正错误。正好手上有纸质书籍,遂决定码一码。 1.应用背景 在分类预测的机器学习任务中,样板实际类别数量可能是极不平衡的。例如,生产线上劣质产品识别,假如良品率有99%,而劣质产 阅读全文
posted @ 2021-03-29 13:31 菲克纽斯 阅读(391) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示