hanlp添加词典不起作用
不起作用的原因很多,这里列举几个
这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件 data下载地址https://pan.baidu.com/s/1o8Rri0y
1、没有删除custom文件夹下的所有bin文件
当添加新词典后,没有删除原来自动生成的缓存词典,直接运行不成功。所以要删除这个文件
2、hanlp.properties中配置不对(注意这个文件的位置)
· root=D:/Project/public_sentiment_monitor/plugin/项目名字(hanlp2)/
3、字典文本类型utf-8
4、添加的词典还要添加到CustomDictionaryPath中 如:
CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt; 机构名词典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;data/dictionary/custom/my.txt
5、字典内的文本不要有空格
如:我爱我 家 n 1
这里我爱我家不能断
测试程序:
String text = "比妳聰明的人,請不要讓他還比妳努力"; System.out.println(HanLP.segment(text)); // 分词 System.out.println(HanLP.extractKeyword(text, 2)); // 提取关键字,同时指定提取的个数 System.out.println(HanLP.extractPhrase(text, 2)); // 提取短语,,同时指定提取的个数 System.out.println(HanLP.extractSummary(text, 2)); // 提取摘要,同时指定提取的个数 System.out.println(HanLP.getSummary(text,10)); //提取短语,同时指定摘要的最大长度 System.out.println(HanLP.convertToTraditionalChinese(text)); // 简体字转为繁体字 System.out.println(HanLP.convertToSimplifiedChinese(traditionText)); // 繁体字转为简体字 System.out.println(HanLP.convertToPinyinString(text, " ", false)); // 转为拼音
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了