集合“纯度”,熵值越小,纯度越高(标签越一致)
信息增益
本身是对离散型数据来切分的,
假设数据取值特别多,比如order_id,它会把每一个order划分到一个分支里,但这样没有意义。可以理解为容易过拟合。