随机森林计算特征对目标的重要程度——置换检验

我们都知道,在调用sklearn中的随机森林时,是可以通过feature_importances_查看每个特征的重要程度的。

其主要通过置换检验来求得特征的重要程度。

如果特征k是重要的,那么用随机的值将该列特征破坏,重新训练和评估,计算模型的泛化能里的退化程度,即:

  inportance(k) = Performance(G) - performance(G')

退化的程度可以度量特征k的重要性。

posted @ 2019-08-01 11:36  张知行  阅读(1972)  评论(0编辑  收藏  举报