摘要:
nlp 常用工具 转自 http://www.cppblog.com/baby-fly/archive/2010/10/08/129003.html *NLP Toolbox CLT http://complingone.georgetown.edu/~linguist/compling.html 阅读全文
摘要:
大家都知道TreeTagger是一个用于词性标注和词型还原的工具,它的返回结果由三部分组成:目标词汇,词性,原形。那该工具是怎样判断目标词汇的词性的呢?又是怎样得到目标词汇的原形的呢?本文就是从这两个问题入手,对TreeTagger的原理进行简单的介绍。 1. 词性的识别判断 这里词性的识别采用的决 阅读全文
摘要:
1.词型还原与词干提取之间的区别与联系 词型还原:把任何形式的语言词汇还原成一般形式,还原后得到的那个词是具有一定意义的。 词干提取:把任何形式的语言词汇还原成它对应的词干或词根,但词干或词根本身不一定有意义。 联系:目前实现词型还原和词干提取的主流方法均是利用语言中存在的规则或者词典映射。 区别: 阅读全文