java 支持分词的高性能拼音转换工具,速度是 pinyin4j 的两倍
摘要:pinyin "pinyin" 是 java 实现的高性能中文拼音转换工具。 "变更日志" 创作目的 想为 java 设计一款便捷易用的拼音工具。 "如何为 java 设计一款高性能的拼音转换工具 pinyin4j" 特性 "性能是 pinyin4j 的两倍" 极简的 api 设计 支持转换长文本
阅读全文
posted @
2020-01-18 22:46
老马啸西风
阅读(556)
推荐(1) 编辑
结巴分词 java 高性能实现,优雅易用的 api 设计,性能优于 huaban jieba 分词
摘要:Segment "Segment" 是基于结巴分词词库实现的更加灵活,高性能的 java 分词实现。 "变更日志" 创作目的 分词是做 NLP 相关工作,非常基础的一项功能。 "jieba analysis" 作为一款非常受欢迎的分词实现,个人实现的 "opencc4j" 之前一直使用其作为分词。
阅读全文
posted @
2020-01-14 20:59
老马啸西风
阅读(1918)
推荐(0) 编辑
java 实现敏感词(sensitive word)工具详解使用说明
摘要:sensitive word 平时工作中,只要涉及到用户可以自由发言(博客、文档、论坛),就要考虑内容的敏感性处理。 "sensitive word" 基于 DFA 算法实现的高性能敏感词工具。工具使用 java 实现,帮助我们解决常见的问题。 特性 6W+ 词库,且不断优化更新 基于 DFA 算法
阅读全文
posted @
2020-01-09 14:45
老马啸西风
阅读(1797)
推荐(0) 编辑