eeshaxia

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

通过读源码

判定过程如下

1. 分词, 得到 w1, w2, w3, ....., wn

2. 贝叶斯判定

构建 neg, pos数组A、B

数组 = 

  log(属于该数组的词 - 所有词)

  + log(分词w1~wn在该数组[neg、pos]的频次)

 

pos | neg 概率 = 

  exp(数组[neg | pos] - 数组[pos | neg]

 

即相反的类别剪该类别取指数

 

posted on 2017-04-12 15:32  eeshaxia  阅读(366)  评论(1编辑  收藏  举报