一: AI 的一些基本概念

1.大模型的演变
机器学习 : 监督学习(人为的告知) 和无监督学习(不进行干预) 和强化学习(奖惩的方式) 和深度学习(模拟人的大脑)
大模型: 卷基座，如参数；卷模型的应用，如rag工作流，agent中台；卷多模(文本，图片，视频)

2.大模型的使用与训练
大模型的使用： prompt，提示词的工程
大模型的训练的三个阶段: 预训练、SFT(监督微调)以及RLHF(基于人类反馈的强化学习)
预训练:提升底层的通用能力(3-25岁不断的学习)，不管什么都要去学习。能力: 进行补全句子
SFT(监督微调): 对某一个领域进行深刻的学习，能力: 对问题进行回答
RLHF(基于人类反馈的强化学习): 不懂就问，能力：纠正SFT的回答，通过打分的机制，不断的优化输出的结果。

3.大模型的特点与分类
规模和参数量大、适应性和灵活性强
广泛数据集的预训练、计算资源需求大
分类：
大语言模型(LLM):专注于自然语言处理
多模态模型：多模态能够同时处理和理解不同感知通道。计算机视觉模型，音频处理模型

4.大模型的工作流程(IO)
4.1分词化与词表映射
更具词粒度和字符粒度和子词粒度将其分解为更小的粒度
词根的映射，就是说，将一个单词映射成一个元素的 token id，这是token的"身份证"，实际上给了一串数字
然后根据概率进行补全后面的单词。
比如 lark is a __ 根据最后的概率来进行填写最后一个单词

5.大模型的应用
同义千问的官网去寻找

可以添加官方微信【LarkMidTable2021】,群为VIP群，需要赞助10元才可以添加 , 添加时备注【AI】，可以参与讨论AI啦！

posted @ 2025-01-31 11:01 LarkMidTable 阅读(107) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 1.AI 大模型的基本概念

· 2.AI大模型项目实战

· 认识大模型

· AI-介绍

· AI_当前大模型的应用方向_技术人员

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配，妙~啊~

公告

昵称： LarkMidTable
园龄： 10年11个月
粉丝： 2
关注： 1

+加关注

2025年3月

日

一

二

三

四

五

六

Lark

一: AI 的一些基本概念

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜