摘要: 在自然语言处理领域中,将单词(words)或词语(phases)映射到向量空间(vector space)中可以很容易就得到单词之间的相似度,因为向量空间中两个向量的相似度很容易求得,比如余弦相似度。1. word2vecword2vec:一种无监督深度学习方法,... 阅读全文
posted @ 2017-05-28 22:17 未雨愁眸 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 1. one hot encodersklearn.preprocessing.OneHotEncoderone hot encoder 不仅对 label 可以进行编码,还可对 categorical feature 进行编码:>>> from sklearn.pr... 阅读全文
posted @ 2017-05-28 19:19 未雨愁眸 阅读(495) 评论(0) 推荐(0) 编辑