拉普拉斯平滑处理 Laplace Smoothing

其实就是计算概率的时候，对于分子+1，避免出现概率为0。这样乘起来的时候，不至于因为某个量x，在观察样本库（训练集）中没有出现过，会导致整个实例的概率结果是0。在文本分类的问题中，当一个词语没有在训练样本中出现，该词语调概率为0，使用连乘计算文本出现概率时也为0。这是不合理的，不能因为一个事件没有观察到就武断的认为该事件的概率是0。

posted @ 2017-03-27 22:33 blcblc 阅读(4603) 评论(0) 收藏举报