[学习记录]NLTK常见操作三(词性标注)
词性标注
首先介绍Penn Treebank的常用POS标记库
标签 | 说明 |
NNP | 专用名词单数 |
NNPS | 专用名词复数 |
PDT | 前置限定词 |
POS | 所有格结束符 |
PRP | 人称代词 |
PRP$ | 所有格代词 |
RB | 副词 |
RBR | 相对副词 |
RBS | 最高级副词 |
RP | 小品词 |
SYM | 数学符号或特殊符号 |
TO | To |
UH | 叹词 |
VB | 动词原形 |
VBD | 动词过去式 |
VBG | 动名词 |
VBN | 动词过去分词 |
WP | Wh代词 |
WP$ | 所有格Wh代词 |
WRB | Wh副词 |
# | 井号 |
$ | 美元 |
. | 句号 |
, | 逗号 |
; | 分号 |
( | 左括号 |
) | 右括号 |
" | 直双引号 |
' | 左单引号 |
" | 左双引号 |
' | 右单引号 |
" | 右双引号 |
具体使用如下: