摘要: InnoDB的全文检索 注:全文为MySQL官网5.7的文档(MySQL 8.0的文档与此几乎一致) MySQL 5.6 不支持中、日、韩语,因为无法对其分词,5.7版本引入NGram(基于字符)对中、日、韩语分词,MeCab(基于单词)支持日语分词。 1、倒排索引 单词与所在文档之间的关系有两种表 阅读全文
posted @ 2023-02-01 15:03 dedication 阅读(166) 评论(0) 推荐(0) 编辑
摘要: TF-IDF 1、概念 TF:term frequency,指一个词项在当前文档中出现的次数 IDF:invert document frequency,逆文档频率 \({idf=log\frac N n}\) ,其中\(N\):集合中文档数量;\(n\):包含词项的文档数量 TF与当前文档有关,I 阅读全文
posted @ 2023-02-01 10:57 dedication 阅读(738) 评论(0) 推荐(0) 编辑