摘要: 词汇表使用one-hot编码,一个词在一列向量里只有一个位置是1,其他位置为0,缺点是浪费空间,而且看不出各个单词之间的关系。 词嵌入用一个高维向量表示一个单词,意思相近的词的词嵌入比较接近,泛化能力强。 高维空间不好表示,t-SNe算法可将高维空间映射为二维空间。apple与orange挨得较近。 阅读全文
posted @ 2019-08-31 21:42 喜琅琅 阅读(908) 评论(0) 推荐(0) 编辑