math-2023-07-21
1、图片截取自《机器学习第二阶段:机器学习经典算法(2)-决策树与随机森林》视频的《2.熵原理形成解读》中04:17,问题是这个熵的计算公式是怎么得来的?溯源到最后的话就是数学期望了,通俗解读可参考:(1)https://blog.csdn.net/L__ear/article/details/100059068,(2)https://www.zhihu.com/tardis/bd/ans/1296806058?source_id=1001。
2、图片截取自《机器学习第二阶段:机器学习经典算法(2)-决策树与随机森林》视频的《5.信息增益率》中06:46,信息增益率等于信息增益除以自身熵,为什么是除以自身熵而不是其它?因为自身熵代表分支数,如果分支数越多说明越不纯,那么自身熵越大,如果信息增益在很大的情况下分支数还少,这时选作节点才能达到更好的效果,而仅靠信息增益这一个指标进行判断是不靠谱的 (例如某一特征下分支很多但每个分支所带信息数很少只有零星几个)。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了