大语言模型LLM相关资料

大模型超详细解读 (目录) - 知乎

大语言模型LLM之GPT系列 - Picassooo - 博客园

大语言模型LLM之LLaMa系列 - Picassooo - 博客园

大语言模型LLM之MoE系列 - Picassooo - 博客园

 

An Introduction to VLMs: The Future of Computer Vision Models | by Ro Isachenko | Nov, 2024 | Towards Data Science

又一个多模态模型在HuggingFace上火了:参数量只有968M! (Omnivision

张奇的《大规模语言模型-从理论到实践》的部分代码:intro-llm/intro-llm.github.io: website

 

Vicuna:

LLMs之Vicuna:《Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality》翻译与解读-CSDN博客

 

大模型的训练过程

【基础】大模型的知识训练:模型训练的四个阶段 - 知乎

从零开始训练大模型全面指南:预训练、指令微调、奖励模型、强化学习-CSDN博客

 

语言模型建模过程中隐含地构建了包括事实性知识(Factual Knowledge)和常识知识(Commonsense)在内的世界知识(World Knowledge)。

 

posted @   Picassooo  阅读(22)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
历史上的今天:
2020-12-07 命令行终端显示和不显示输出【转】
2020-12-07 pytorch tensorboard在本地和远程服务器使用,两条loss曲线画一个图上
点击右上角即可分享
微信分享提示