Java分布式中文分词组件 - word分词 - 自定义停用词

GitHub地址 : https://github.com/ysc/word

需求说明:要增加停用词
1:导包
<dependencies>
    <dependency>
        <groupId>org.apdplat</groupId>
        <artifactId>word</artifactId>
        <version>1.3</version>
    </dependency>
</dependencies>
代码中添加自定义的停用词:
WordConfTools.set("stopwords.path", "classpath:stopwords.txt,D:/Project/Code/stopword");
分词部分看具体的api

 

posted @ 2020-09-18 16:16  涂小二  阅读(618)  评论(0编辑  收藏  举报