随笔分类 - 数据建模笔记
摘要:描述 本文归纳数据清洗后到建模前的工作内容。随着阅读量和工作经验的增加慢慢扩充积累 在数据清洗结束后,要着手分析各项特征,进行筛选建模。特征的分析和筛选是建模工作中最繁杂、工作量最高的环节。 在sklearn的apifeature_selection中有很多通识方法,此外在部分模型如随机森林中集成有
阅读全文
摘要:准确率和召回率 本来我开始以为准确率召回率这种东西不用记得太详细,用到的时候随手百度一下就行。但尝试搜了几篇文章评论区都有指正错误。正好手上有纸质书籍,遂决定码一码。 1.应用背景 在分类预测的机器学习任务中,样板实际类别数量可能是极不平衡的。例如,生产线上劣质产品识别,假如良品率有99%,而劣质产
阅读全文