NLP 开源形近字算法之相似字列表(番外篇)
摘要:创作目的 国内对于文本的相似度计算,开源的工具是比较丰富的。 但是对于两个汉字之间的相似度计算,国内基本一片空白。国内的参考的资料少的可怜,国外相关文档也是如此。 本项目旨在抛砖引玉,实现一个基本的相似度计算工具,为汉字 NLP 贡献一点绵薄之力。 推荐阅读: NLP 中文形近字相似度计算思路 中文
阅读全文
posted @
2023-03-28 14:02
老马啸西风
阅读(212)
推荐(1) 编辑
001-ksum 求符合条件的 k 个数 1. Two Sum/15. 3Sum/18. 4Sum/
摘要:推荐阅读 000-从零开始的数据结构与算法 001-01-ksum 求符合条件的 k 个数 1. Two Sum/15. 3Sum/18. 4Sum/ 002-两数相加 add two numbers 003-无重复字符的最长子串 Longest Substring Without Repeatin
阅读全文
posted @
2023-03-22 15:45
老马啸西风
阅读(52)
推荐(0) 编辑
改进 hibernate-validator,新一代校验框架 validator 使用介绍 v0.4
摘要:项目介绍 java 开发中,参数校验是非常常见的需求。但是 hibernate-validator 在使用过程中,依然会存在一些问题。 validator 在 hibernate-validator 等校验工具之上,做了一些改进,使其使用更加便捷优雅,进一步提升工作效率。 变更日志 变更日志 特性
阅读全文
posted @
2023-03-20 17:33
老马啸西风
阅读(327)
推荐(0) 编辑
java 中文繁简体转换工具 opencc4j 使用介绍 1.8.0
摘要:Opencc4j Opencc4j 支持中文繁简体转换,考虑到词组级别。 在线体验 Features 特点 严格区分「一简对多繁」和「一简对多异」。 完全兼容异体字,可以实现动态替换。 严格审校一简对多繁词条,原则为「能分则不合」。 词库和函数库完全分离,可以自由修改、导入、扩展。 兼容 Windo
阅读全文
posted @
2023-03-14 13:40
老马啸西风
阅读(648)
推荐(0) 编辑