摘要: 词向量: GloVe词向量:2014年的英文维基百科上训练。400k词,每个词用100维向量表示。 数据集: 20种新闻文本数据。 建模步骤: 1.把新闻样本转化为词索引序列。 词索引:每个词依次分配一个ID,只保留最常见的词(设置vocabulary_size)。 2.生成一个词向量矩阵。第i行表 阅读全文
posted @ 2020-09-29 22:36 猫七的blog 阅读(276) 评论(0) 推荐(0) 编辑
摘要: Lambda架构介绍 https://blog.csdn.net/rav009/article/details/85690985 从业务角度,数据的应用有实效性,常见电子商务。有的数据的应用对实效性要求比较低。比如客户画像分析。 所以lambda架构分为两种解决方法。 第一种是speed layer 阅读全文
posted @ 2020-09-29 14:59 猫七的blog 阅读(429) 评论(0) 推荐(0) 编辑