摘要: trie人称字典树,又称前缀树,是一个比较高效的字符串检索的存储方式。 trie的应用可以详见leetcode。 DoubleArrayTrie是一个trie的升级版,通过两个数组来实现trie。性能有所提高。 https://www.cnblogs.com/zhangchaoyang/articl 阅读全文
posted @ 2020-04-01 16:09 _Meditation 阅读(252) 评论(1) 推荐(0) 编辑
摘要: 本次调研3种工具pinyin4j;jpinyin;hanlp。经过从 运行时间;词典维护代价;源代码社区活跃程度及更新速度 几方面考虑,推荐使用hanlp进行汉语转拼音。 1. Pinyin4j 虽然此jar包描述信息包括可以对多音字进行识别,但是其处理逻辑是对多音字取第一个拼音。例如”长”的拼音数 阅读全文
posted @ 2020-04-01 12:33 _Meditation 阅读(1915) 评论(0) 推荐(0) 编辑