摘要:
我们将不同长度的句子(预处理并分词之后的长度)直接做比较其实是不公平的,举个例子: Sentence 1 = 长度为2 Sentence 2 = 长度为1 Sentence 3 = 长度为3 (在取相似词TOP4,exp=0.7,的情况下) 即便Sent2与Sent1词的组成完全不同,base_si 阅读全文
摘要:
one-hot映射时,如何选取TOPN作为每一个词承载的word2vec的信息? 我们已经知道,对于这种例子: 怎么绑定手机号? 怎么关联手机号? 他们的相似度取决于绑定和关联这两个词如何相似。 阅读全文