01 2025 档案
摘要:假设: 输入(中文): "我有一本书" 目标(英文): "I have a book" A,一般过程 一,训练阶段: 在 训练阶段,我们希望训练模型从源语言(中文)生成目标语言(英文)。在这个过程中,解码器依赖于编码器的输出,并通过与目标序列进行比较来计算损失,并优化模型参数。 # 1. 输入序列(
阅读全文
摘要:1,词向量的本质 词向量(WordEmbedding)是通过训练得到的低维稠密向量,用于表示词汇的语义信息。在训练过程中,词向量不仅捕捉了词汇的自身特征(如词义、词性),还捕捉了词汇的上下文特征(如语法角色、位置信息、与其他词的关系)。 2,词向量的维度 词向量的每个维度并不是独立的,而是通过训练数
阅读全文