摘要: 我们将不同长度的句子(预处理并分词之后的长度)直接做比较其实是不公平的,举个例子: Sentence 1 = 长度为2 Sentence 2 = 长度为1 Sentence 3 = 长度为3 (在取相似词TOP4,exp=0.7,的情况下) 即便Sent2与Sent1词的组成完全不同,base_si 阅读全文
posted @ 2018-11-08 15:33 yjy888 阅读(321) 评论(0) 推荐(0) 编辑
摘要: one-hot映射时,如何选取TOPN作为每一个词承载的word2vec的信息? 我们已经知道,对于这种例子: 怎么绑定手机号? 怎么关联手机号? 他们的相似度取决于绑定和关联这两个词如何相似。 阅读全文
posted @ 2018-11-08 11:13 yjy888 阅读(473) 评论(0) 推荐(0) 编辑