摘要:
传统的count-base representation有什么问题呢,可以看下图 观察句式2,其对应的向量中he所在位置的元素值是2,因为he在原句中出现了2次。可是,he在这一句中,并不算是关键词,事实上,denied和lied才是句子2的关键词,但是他们只出现了一次,所以在向量中对应位置的元素值 阅读全文
摘要:
欧氏距离:如下图所示,欧氏距离越小,表示句子之间相似度越高 余弦相似度:如下图,余弦相似度越大,代表相似度越高。欧氏距离么有考虑向量的方向这一大要素,所以余弦相似度更贴切一些。 阅读全文