用动态规划和语言模型进行分词和词性标注
摘要:
词性标注:输入:句子W=w1w2...wn以及每个wi可能的pos(假设每个w都有K个可能的pos)输出:POS=pos1pos2...posnsolution:f(i)表示从开始到位置i的最优pos序列的score;q(i)表示位置i的最佳posiinitialization:f(0..n)=0,q(0..n)=-1;iteration:for(int i = 1; i< n; i++){ int max = -1; for(int k = 1; k<K; k++) { int value = f(i-1)+unigram(i,k)+big... 阅读全文
posted @ 2013-04-10 15:51 flywithyou 阅读(1161) 评论(0) 推荐(0) 编辑