中文命名实体识别总结
欢迎大家关注我的知乎专栏,那里会分享我的项目总结以及所看的好博客
前段时间做了命名实体识别这个项目,在这里总结一下资源
命名实体识别的资料网上不多,尤其是让我们可以跟着做的。想要做这个方向,可以先找简单的入手。语料可以用人民日报标注语料,目前流行的方法有两种,一种基于CRF,一种基于深度学习。我个人强烈建议先做项目,再去深入理解原理,这两者相辅相成,才能成大事
本文脉络简单,就是从项目和原理两方面推荐给大家相关的博客
首先给大家一个开胃菜,先入门一下命名实体识别,总不能做了半天不知道自己在干什么吧
命名实体识别(NER)的二三事
一.项目
方法一:基于CRF做命名实体识别
- 用CRF做命名实体识别(一)主要介绍的是关于人民日报标注语料的预处理,利用CRF++工具包对模型进行训练以及测试。
- 用CRF做命名实体识别(二)主要是升级对上一篇升级,新添加了一些特征,着重介绍了如何生成组织名特征词这个特征。大家也许看的一知半解,进去读读便豁然开朗了
- 用CRF做命名实体识别(三)主要是总结了所有特征的生成思路,并对它们做了一个效果对比
方法二:基于深度学习做命名实体识别
用深度学习做命名实体识别(附代码) 主要简单的介绍下BILSTM-CRF的原理,以及如何把大佬的数据集换成我们自己的数据集,进行训练。
二. 原理
原理的理解很不容易,这里主要推荐阅读书籍和博客。主读书籍,用博客来辅助理解
书籍推荐:吴军的《数学之美》,周志华的西瓜书《机器学习》,李航的《统计学习方法》
博客推荐:
1. CRF的原理介绍
如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别?
2. HMM的原理介绍
一文搞懂HMM(隐马尔可夫模型) - skyme - 博客园
机器学习 --- 4. 大内密探HMM(隐马尔可夫)围捕赌场老千
3. BILSTM的原理介绍
推荐给初学LSTM或者懂个大概却不完全懂的人 - CSDN博客
三. 总结
中文的命名实体识别就到这里了,大家有疑问欢迎提出来一起探讨。另外要转载的话请联系我,谢谢各位了
欢迎扫码关注
本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢!