《统计学习方法》笔记--条件随机场

条件随机场(conditional random field,CRF),常用于标注或分析序列资料,如自然语言文字或是生物序列。即给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型。

图1-1 线性链条件随机场

 

设P(Y|X)为线性链条件随机场,则随机变量X在取值为x的条件下,随机变量Y取值为y的条件概率的形式如下,

是定义在边上的特征函数(转移函数),依赖于当前位置和前一个位置;是结点的状态特征函数,依赖于当前位置,而且这两个特征函数都有依赖于观测随机变量x 的取值。

 

例子:有一标注问题,观测序列,输出的标记序列为取值为1 或 2。

转移的特征函数和状态的特征函数如下(对于未列出的特征函数,其取值为0):

对给定的观测序列x,根据上面特征函数求标记序列的非规范化条件概率

根据:

条件随机场还可以简化为如下形式,

假设有个转移特征函数和个状态特征函数,记

表示特征函数的权值,即

于是,线性链条件随机场可表示为

 

线性链条件随机场和一阶线性隐马尔可夫模型有几分相似之处,两者当前位置的都依赖于前一位置的信息,在求解概率问题的方法上都利用到前向-后向算法和维比特算法,而两者的区别在于:线性链条件随机场是判别式模型,一阶线性隐马尔可夫模型是生成模型。

 

 

 

 

posted @ 2020-03-24 22:12  lincoding`  阅读(341)  评论(0编辑  收藏  举报