摘要: http://www.52nlp.cn/%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%85%A5%E9%97%A8%E4%B9%8B%E5%AD%97%E6%A0%87%E6%B3%A8%E6%B3%954上一节主要介绍的是利用最大熵工具包来做字标注中文分词,这一节... 阅读全文
posted @ 2015-01-04 16:52 Django's blog 阅读(870) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/marising/article/details/5769653前段时间写了中文分词的一些记录里面提到了CRF的分词方法,近段时间又研究了一下,特把方法写下来,以备忘,另外,李沫南同学优化过CRF++,见:http://www.coreseek.cn/ope... 阅读全文
posted @ 2015-01-04 16:46 Django's blog 阅读(1321) 评论(0) 推荐(0) 编辑
摘要: http://biancheng.dnbcw.info/java/341268.htmlCRF简介ConditionalRandomField:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:... 阅读全文
posted @ 2015-01-04 16:28 Django's blog 阅读(3724) 评论(0) 推荐(0) 编辑
摘要: http://langiner.blog.51cto.com/1989264/379166原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://langiner.blog.51cto.com/1989264/379166条件随机场 (CRF... 阅读全文
posted @ 2015-01-04 14:58 Django's blog 阅读(893) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/heavendai/article/details/70301021.首先来说一下马尔科夫链。一个事件序列发生的概率可以用下面的概率论里面的乘法公式展开P(w1,w2,…wn) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…w... 阅读全文
posted @ 2015-01-04 14:46 Django's blog 阅读(315) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/heavendai/article/details/72285241. 简述 最近要应用CRF模型,进行序列识别。选用了CRF++工具包,具体来说是在VS2008的C#环境下,使用CRF++的windows版本。本文总结一下了解到的和CRF++工具包相关的信... 阅读全文
posted @ 2015-01-04 14:45 Django's blog 阅读(470) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/heavendai/article/details/7228621CRF(Conditional Random Field) 条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析、命名实体识别、词性标注等。在我看来,CRF就像一个反向的隐马尔可夫... 阅读全文
posted @ 2015-01-04 14:36 Django's blog 阅读(635) 评论(0) 推荐(0) 编辑
摘要: http://blog.sina.com.cn/s/blog_605f5b4f010109z3.html首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像词性标注,True casing。但隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的特... 阅读全文
posted @ 2015-01-04 14:35 Django's blog 阅读(1755) 评论(0) 推荐(0) 编辑