摘要: 太长不看版: 如果非直接使用nn.Embedding而使用nn.Embedding.weight来作为变量,其随机初始化方式是自带标准正态分布,即均值,方差的正态分布。 下面是论据 源代码: import torch from torch.nn.parameter import Parameter 阅读全文
posted @ 2024-09-11 19:29 龙雪 阅读(6) 评论(0) 推荐(0) 编辑