噪声信道模型zz
来自HIT ByteChen http://hi.baidu.com/bytechen/blog/item/5af609245ad4b6064d088d78.html
噪声信道模型是一个非常重要的模型,它在很多领域都有非常重要的应用。它是在上世纪80年代在语音识别领域引起人们的重视的。
噪声信道模型的形式很简单,如图所示:
![](http://hiphotos.baidu.com/bytechen/pic/item/38d8321b8b3c2fc9ac6e75cf.jpg)
图1 噪声信道模型
噪声信道试图通过有噪声的输出信号恢复输入信号。它用下面的公式定义:
对于某一输入信号,此信号通过会产生噪声的转换信道得到输出信号,现在假设我们已知道输出信号,求解它的输入信号,那么就会用到此模型。
已知道输出为O,求解它的最大可能输入I,即在O下条件概率最大的那个I,通过贝叶斯公式转换就可以得到
对于某一个特定的输出,显然P(O)是不变的,所以可以不用管P(O),于是原式可以再次化简为argmaxP(o|I)P(I). 我们一般把P(I)叫做语言模型,P(O|I)叫做转换模型。
噪声信道模型是一种普适型的模型,通过重新修改噪声信道的定义,可以用它来解决很多问题。下面我们就看看噪声信道模型的应用。
语音识别
信息源对应于以概率P(T)生成语句文本,噪声信道对应于以概率分布P(S|T)将语句文本转换成声音信号。语音识别的目的就是由通过噪声信道而输出的声音信号恢复其原始的语句文本。
一个声学信号对应一个语句,语音识别器要做的就是找出对应一个声学信号的可能性最大的语言文本。设声学信号为S,文本为T,则T=argmaxP(T|S)=argmaxP(S|T)P(T).
机器翻译
目标语言的文本-〉翻译-〉源语言文本
手写体识别
文本-〉书写(或者打印、扫描)-〉图像
文本校错
文本-〉输入编辑-〉带有错误的文本
就简单的举上面几个例子吧,其实噪声信道模型很强大的,它还可以做词性标注、音字转换等。
至于P(I)和P(O|I)怎么算,很简单,我们可以通过训练模型得到。