随笔分类 -  自然语言处理

摘要:给定一个观察序列O=O1O2...OT,和模型μ=(A,B,π),如何快速有效地选择在一定意义下“最优”的状态序列Q=q1q2...qT,使该状态最好地解释观察序列。 一种想法是求出每个状态的概率rt(i)最大(rt(i)=P(qt=si,O|μ)),记q't(i)=argQmax(rt(i)),但 阅读全文
posted @ 2012-12-04 22:13 jihite 阅读(16362) 评论(3) 推荐(3) 编辑
摘要:对于HMM的评估问题,利用动态规划可以用前向算法,从前到后算出前向变量;也可以采用后向算法,从后到前算出后向变量。先介绍后向变量βt(i):给定模型μ=(A,B,π),并且在时间时刻t状态为si的前提下,输出序列为Ot+1Ot+2...OT的概率,即 βt(i)=P(Ot+1Ot+2...OT|qt... 阅读全文
posted @ 2012-12-03 22:42 jihite 阅读(9264) 评论(11) 推荐(1) 编辑
摘要:隐马模型的评估问题即,在已知一个观察序列O=O1O2...OT,和模型μ=(A,B,π}的条件下,观察序列O的概率,即P(O|μ} 如果穷尽所有的状态组合,即S1S1...S1, S1S1...S2, S1S1...S3, ..., S3S3...S3。这样的话t1时刻有N个状态,t2时刻有N个状态...tT时刻有N个状态,这样的话一共有N*N*...*N= NT种组合,时间复杂度为O(NT),计算时,就会出现“指数爆炸”,当T很大时,简直无法计算这个值。为解决这一问题,Baum提出了前向算法。 归纳过程 首先引入前向变量αt(i):在时间t时刻,HMM输出序列为O1O2...OT,在第t时. 阅读全文
posted @ 2012-12-01 13:35 jihite 阅读(9337) 评论(4) 推荐(8) 编辑
摘要:在马尔可夫模型中,每一个状态都是可观察的序列,是状态关于时间的随机过程,也成为可视马尔可夫模型(Visible Markov Model,VMM)。隐马尔科夫模型(Hidden Markov Model,HMM)中的状态是不可见的,我们可以看到的是状态表现出来的观察值和状态的概率函数。在隐马模型中... 阅读全文
posted @ 2012-11-30 22:53 jihite 阅读(11688) 评论(7) 推荐(2) 编辑
摘要:简介 马尔可夫模型(Markov Model)描述了一类随机变量随时间而变化的随机函数。考察一个状态序列(此时随机变量为状态值),这些状态并不是相互独立的,每个状态的值依赖于序列中此状态之前的状态。 数学描述 一个系统由N个状态S= {s1,s2,...sn},随着时间的推移,该系统从一个状态转换成 阅读全文
posted @ 2012-11-29 23:06 jihite 阅读(10971) 评论(5) 推荐(3) 编辑
摘要:20世纪80年代更早提出的分词方法大部分是基于词表进行的,称为基于词表分词方法。近10年来,随着统计方法的迅速发展,人们提出很多基于统计的模型分词方法和规则方法与统计方法相结合的分词技术,称为基于统计模型的分词方法。 假设随机变量S为一个汉字序列,W是S上所有可能切分出来的词序列,分词过程应该是求解条件概率P(W|S)最大的词序列W',即 W' = argwmaxP(W|S) -------------------------------1根据贝叶斯公式:P(AB) = P(A)P(B|A) = P(B)P(A|B) 1式变为: W' = argwmaxP(W)P(S| 阅读全文
posted @ 2012-11-20 23:20 jihite 阅读(2724) 评论(0) 推荐(0) 编辑