随笔 - 16  文章 - 0  评论 - 5  阅读 - 17711
09 2023 档案
自然语言的处理 nlp
摘要:分词 得到语言首先使用分词机器进行分词 首先使用正则表达式过滤标点 空格,一般使用NLTK进行首次分词 n-gram 相邻的词组成短语,更有意义。 停用词的过滤 a an the of之类 大小写转换 词干还原house houses houseing 还原成house ,nltk.stem.por 阅读全文
posted @ 2023-09-05 22:45 black2bi 阅读(15) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示