亲爱的,外面没有别人,请出来晒晒|

AAA建材王师傅

园龄:2年6个月粉丝:4关注:1

03 2025 档案

DeepSeek MOE 代码实现
摘要:import torch from torch import nn # ExpertNetwork 类:定义每个专家的网络 class ExpertNetwork(nn.Module): def __init__(self, hidden_size, intermediate_size): supe
17
0
0
点击右上角即可分享
微信分享提示
深色
回顶
收起