摘要:
1. 词向量上的操作(Operations on word vectors) 因为词嵌入的训练是非常耗资源的,所以ML从业者通常 都是 选择加载训练好 的 词嵌入(Embedding)数据集。(不用自己训练啦~~~) 任务: 导入 预训练词向量,使用余弦相似性(cosine similarity)计 阅读全文
摘要:
import codecs def read_glove_vecs(glove_file): with open(glove_file, 'r', encoding='utf-8') as f: # 修改这个 words = set() word_to_vec_map = {} for line i 阅读全文