随笔分类 - 机器(深度)学习 / NLP / 大模型
训练的评估函数
摘要:分类任务 import numpy as np import evaluate metric = evaluate.load("accuracy") def compute_metrics(eval_pred): logits, labels = eval_pred predictions = np
阅读全文
AutoPeftModel、AutoModel、PeftModel
摘要:官网: AutoPeftModel类通过从配置文件中自动推断任务类型来加载适当的PEFT模型。它们被设计成在一行代码中快速、轻松地加载PEFT模型,而不必担心您需要哪个确切的模型类,或者手动加载PeftConfig.v AutoModel、Transformers提供了一种简单统一的方法来加载预训练
阅读全文
parameter-Efficient-fine-tuning 部分参数微调(PEFT)
摘要:PEFT(Parameter-Efficient Fine-Tuning参数高效微调) huggingface:PEFT (huggingface.co) github:GitHub - huggingface/peft: 🤗 PEFT: State-of-the-art Parameter-Ef
阅读全文
LLAMA(羊驼)介绍
摘要:开源的大模型 下载又是github 又是申请账号,可能还有代理的问题。 下载的模型是pth,还不能用,还要转换成huggingface格式。 所以直接从huggingface下载就完事了
阅读全文
什么是大模型
摘要:什么是大模型 "大模型"通常指的是深度学习中参数数量庞大、层数深厚的神经网络模型。这些模型具有数十亿甚至上百亿的参数,通常需要大量的计算资源来进行训练和推断。这种规模的模型在处理复杂任务时表现得很出色,因为它们能够从大量的数据中学到更复杂、更抽象的表示。 例如,GPT-3(Generative Pr
阅读全文