随笔分类 - 自然语言 / 自然语言基础
摘要:4隐马尔可夫模型与序列标注 序列标注问题 •序列标注(tagging)指的是给定一个序列x=x_1 x_2…x_n,找出序列中每个元素对应标签y=y_1 y_2…y_n的问题 其中,y所有可能的取值集合称为标注集(tagset) 序列标注与中文分词 考虑一个字符序列x,想象切词器真的是拿刀切割字符串
阅读全文
摘要:词典 hanlp词典 希望 v 386 n 96 vn 25 nz 1 希特勒 nr 3 希玛 nz 1 希罕 a 1 希翼 v 1 希腊 ns 19 词类 词频 词典加载 from pyhanlp import * def load_dictionary(): """ 加载HanLP中的mini词
阅读全文