03 2018 档案
摘要:众所周知,通过Bilstm已经可以实现分词或命名实体标注了,同样地单独的CRF也可以很好的实现。既然LSTM都已经可以预测了,为啥要搞一个LSTM+CRF的hybrid model? 因为单独LSTM预测出来的标注可能会出现(I-Organization->I-Person,B-Organization ->I-Person)这样的问题序列。
阅读全文
摘要:在自然语言处理中(NLP,Natural Language ProcessingNLP,Natural Language Processing),分词是一个较为简单也基础的基本技术。常用的分词方法包括这两种:**基于字典的机械分词** 和 **基于统计序列标注的分词**。对于基于字典的机械分词本文不再赘述,可看[字典分词方法](https://spaces.ac.cn/archives/3908 "字典分词方法")。在本文中主要讲解基于深度学习的分词方法及原理,包括一下几个步骤:`1标注序列`,`2双向LSTM网络预测标签`,`3Viterbi算法求解最优路径`
阅读全文