摘要: 1. 词向量上的操作(Operations on word vectors) 因为词嵌入的训练是非常耗资源的,所以ML从业者通常 都是 选择加载训练好 的 词嵌入(Embedding)数据集。(不用自己训练啦~~~) 任务: 导入 预训练词向量,使用余弦相似性(cosine similarity)计 阅读全文
posted @ 2020-06-29 23:13 douzujun 阅读(679) 评论(0) 推荐(0) 编辑
摘要: import codecs def read_glove_vecs(glove_file): with open(glove_file, 'r', encoding='utf-8') as f: # 修改这个 words = set() word_to_vec_map = {} for line i 阅读全文
posted @ 2020-06-29 22:46 douzujun 阅读(855) 评论(0) 推荐(0) 编辑