关于高斯分布的注记

    在学习NLP,ML的时候,经常会用到高斯分布。为什么假设一些数据服从高斯分布呢?很直观的原因是现实生活中的例子一般满足高斯分布,比如学生的成绩分布等。直到看了Ng的《机器学习》课之后,才明白原因。

1. 高斯分布便于计算。

2. 对实际数据建模的时候,通常会做一些假设。然后模型和实际数据之间会有一定的误差,这些误差是随机的,有各种各样的原因会引起误差,各种因素之间是相互独立的,且假定满足某一分布(并非同分布)。根据中心极限定理,任意独立的分布的平均分布近似服从正态分布,当样本量足够大的时候。因此,假设误差服从正态分布是合理的。

 

备忘。

posted @ 2013-01-30 15:36  Scott_Ni  阅读(262)  评论(0编辑  收藏  举报