2024年10月26日
摘要: 模型参数量的计算公式 隐藏层大小为:\(d_{model}\) transformer的layer数:\(N\) 嵌入层大小为:\(V_{dim}\) transformer模型参数大小 = \(N\) * (12 * \(d_{model}^2\)+ 13*\(d_{model}\))+ \(V_ 阅读全文
posted @ 2024-10-26 20:01 蔚蓝色の天空 阅读(138) 评论(0) 推荐(0) 编辑