摘要: shingling算法用于计算两个文档的相似度,例如,用于网页去重。维基百科对w-shingling的定义如下: In natural language processing a w-shingling is a set of unique "shingles"—contiguous subsequ 阅读全文
posted @ 2020-07-25 12:50 HuangB2ydjm 阅读(272) 评论(0) 推荐(0) 编辑