machine learning学习笔记

1. 做classfication 时候一定要将label 取成是balanced的,也就是一比一的比例,因为如果不是一比一的比例的话,举个极端一点的例子:如果pos:neg label目前是9:1的比例,那么在模型学习的过程当中,它就会倾向性的选择将大家都分像9份的那一类(即使全部分过去的话,也有90%的精确度)。所以这样子学习出来的模型都带有一定的偏向性。最好是选择1:1的等分sample,再进入学习。

 

To Be Continue...

posted @ 2017-07-16 17:35  蜜宝家的小兔  阅读(125)  评论(0编辑  收藏  举报