2018年12月8日

Data Science Competition中的工具汇总

摘要: 除了基础的pandas,scikit learn,numpy,matplotlib,seaborn以外 ( 1 ) category_encoders "github" 属于scikit learn compatible projects之一,下面是Binary Encoding和One hot E 阅读全文

posted @ 2018-12-08 23:02 Frank_Allen 阅读(295) 评论(0) 推荐(0) 编辑

What makes a good feature

摘要: 从上图中我们可以得到的信息,首先在height低于20时,我们可以很高的概率预测这只狗是拉布拉多犬,而在height高于35时,我们也能相当有信心的预测这只狗是灰猎犬,但是当height位于这两者之间时,两种狗的概率很接近。因此height是一个有用的特征但是并不完美。 所以在机器学习中,我们总是需 阅读全文

posted @ 2018-12-08 18:26 Frank_Allen 阅读(230) 评论(0) 推荐(0) 编辑

导航