摘要:节点分裂,特征选择 从概率学角度,样本集中不同样本类别分布地越均匀,说明不确定性越大,比如投掷硬币,50%正,50%负,完全不确定,而决策树模型就是需要选取特征,通过特征取值对样本进行子集划分,使得子集中的不确定性减少。 描述不确定性的算法模型:1 gini纯度 2 信息熵 两个函数都是在样本分布越
阅读全文
posted @ 2021-02-20 11:32
世界太大,一辈子太短。
posted @ 2021-02-20 11:32
posted @ 2021-02-19 23:52
posted @ 2021-02-12 21:35