2018 年 11月 8 日随笔档案 - yjy888

2018年11月8日

摘要：我们将不同长度的句子（预处理并分词之后的长度）直接做比较其实是不公平的，举个例子： Sentence 1 = 长度为2 Sentence 2 = 长度为1 Sentence 3 = 长度为3 （在取相似词TOP4，exp=0.7，的情况下）即便Sent2与Sent1词的组成完全不同，base_si 阅读全文

posted @ 2018-11-08 15:33 yjy888 阅读(321) 评论(0) 推荐(0) 编辑

one-hot句子向量对比度增强

摘要： one-hot映射时，如何选取TOPN作为每一个词承载的word2vec的信息？我们已经知道，对于这种例子：怎么绑定手机号？怎么关联手机号？他们的相似度取决于绑定和关联这两个词如何相似。阅读全文

posted @ 2018-11-08 11:13 yjy888 阅读(473) 评论(0) 推荐(0) 编辑

公告