NLTK基本使用

NLTK词干提取 (Stemming)

(1) PorterStemmer

from nltk.stem import PorterStemmer
porter_stemmer = PorterStemmer()
print(porter_stemmer.stem('working'))

(2)LancasterStemmer

from nltk.stem import LancasterStemmer
lancaster_stemmer = LancasterStemmer()
print(lancaster_stemmer.stem('working'))

SnowballStemmer 提取非英语单词词干

from nltk.stem import SnowballStemmer
french_stemmer = SnowballStemmer('french')
print(french_stemmer.stem("French word"))

 

posted on 2021-12-04 22:09  季昂  阅读(73)  评论(0编辑  收藏  举报