摘要: 记一下,懒得找了。 语料是NER的古文献语料,参考其他博客代码。 我先将标记的实体提出来,作为自定义字典,加入jieba中,然后再入停用词,再分词,最后训练词向量。效果还不知如何,后续再说。 #加载自定义词典 jieba.load_userdict("cidian.txt") #加载停用词 def 阅读全文
posted @ 2020-07-16 01:22 ho_ho 阅读(406) 评论(0) 推荐(0) 编辑