2014年4月27日
摘要: 背景:为什么要做平滑处理? 零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0。在文本分类的问题中,当一个词语没有在训练样本中出现,该词语调概率为0,使用连乘计算文本出现概率时也为0。这是不合理的,不能因为一个事件没有观察到就武断的认... 阅读全文
posted @ 2014-04-27 11:29 善断风行 阅读(34885) 评论(1) 推荐(3) 编辑