llama的hf源码结构

上一个博客我们看了rope. 那么llama的hidden_states就没啥难点了.
再整体把握一下hf里面llama的代码结构.

文件是:D:\Users\admin\miniconda3\Lib\site-packages\transformers\models\llama\modeling_llama.py

基座:
class LlamaModel(LlamaPreTrainedModel):
这个模型输入 bs, seq_len
输出 bs, seq_len, dim

模型:class LlamaForCausalLM(LlamaPreTrainedModel):
等于LlamaModel接一个linear, 输出下一个字的概率.
class LlamaForCausalLM 跟这个一样. 都是下一个字概率.

class LlamaForSequenceClassification: 句子分类.
 这些分类可以是二分类,多分类.

posted on 2023-12-21 23:00  张博的博客  阅读(67)  评论(0编辑  收藏  举报

导航