机器学习之——决策树信息增益计算[程序+例题]

0 前言

g(play,outlook)表示在随机变量outlook条件下对于目标变量play的信息增益，计算步骤如下。

g(play,temperature)表示在随机变量temperature条件下对于目标变量play的信息增益，计算步骤如下。

完整公式：g(play,temperature)=H(play)-H(play|temperature)
首先要计算H(play)，详细计算方法请看信息熵，计算式如下所示。
然后计算H(play|temperature)，详细计算方法请看条件熵，计算式如下。
H(play|temperature='cool')=-(1.0/4.0)log2(1.0/4.0)-(3.0/4.0)log2(3.0/4.0)=0.8113
H(play|temperature='hot')=-(2.0/4.0)log2(2.0/4.0)-(2.0/4.0)log2(2.0/4.0)=1.0000
H(play|temperature='mild')=-(2.0/6.0)log2(2.0/6.0)-(4.0/6.0)log2(4.0/6.0)=0.9183
H(play|temperature)=(4.0/14)* H(play|temperature='cool')+(4.0/14)* H(play|temperature='hot')+(6.0/14)* H(play|temperature='mild')=0.9111
最后计算g(play,temperature)，计算式如下。
g(play,temperature)=H(play)-H(play|temperature)=0.9403-0.9111=0.0292

如有错误请指正，禁止商用。

posted @ 2024-09-02 17:57 hello_nullptr 阅读(1146) 评论(0) 收藏举报

刷新页面返回顶部