核密度估计
核函数估计
参考这里
-
Kernel Density Estimation, KDE
-
这个东西的目的在于使用离散的样本估计概率密度函数。
-
公式推导:
第1行来自于概率密度函数的定义,是概率分布函数;第2行是在仅有采样数据时对定义的近似,从定义出发看越小越好,但太小可能会使得区间内没有足够的点用于计算概率密度;第4行中的在此处的推导中为。这个函数不光滑,于是就想到把它替换掉,同时将其扩展到维得情形,可以得到一般的形式:
替换的函数需要满足:
所以只需要选取的对概率空间积分为1就好。
-
常见的核函数
假设是维向量,是维空间下单位球的体积。
上述的均匀分布函数:
各阶导数都光滑的标准高斯:
以及Epanechnikov:
-
直观的图形化理解:相当于是在每个采样点处放了个的概率密度分布,然后叠加在一起就构成了估计出的概率密度分布。比如下图左侧是一个二维随机变量的采样数据(为了方便演示,采样点个数取的很少,取得也比较小),右侧对这写数据用Epanechnikov核函数估计的概率密度分布:
本文作者:Harold_Lu
本文链接:https://www.cnblogs.com/harold-lu/p/16746396.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步