摘要: 看到这篇文章才终于被点醒为什么word2vec用W_in 而不用W_out作为最终的vector了:为了优化算法,word2vec的实现都用了负采样 / 层次化softmax方法,所以并不会直接更新理论上W_out输出矩阵,所以这里用W_out意义不大,当然如果不采用 负采样 / 层次化softma 阅读全文
posted @ 2019-07-23 15:59 凌波微步_Arborday 阅读(592) 评论(0) 推荐(0) 编辑