一: AI 的一些基本概念

1.大模型的演变
机器学习 : 监督学习(人为的告知) 和 无监督学习(不进行干预) 和 强化学习(奖惩的方式) 和 深度学习(模拟人的大脑)
大模型: 卷基座,如参数;卷模型的应用,如rag工作流,agent中台;卷多模(文本,图片,视频)


2.大模型的使用与训练
大模型的使用: prompt,提示词的工程
大模型的训练的三个阶段: 预训练、SFT(监督微调)以及RLHF(基于人类反馈的强化学习)
预训练:提升底层的通用能力(3-25岁不断的学习),不管什么都要去学习。能力: 进行补全句子
SFT(监督微调): 对某一个领域进行深刻的学习,能力: 对问题进行回答
RLHF(基于人类反馈的强化学习): 不懂就问,能力:纠正SFT的回答,通过打分的机制,不断的优化输出的结果。


3.大模型的特点与分类
规模和参数量大、适应性和灵活性强
广泛数据集的预训练、计算资源需求大
分类:
大语言模型(LLM):专注于自然语言处理
多模态模型:多模态能够同时处理和理解不同感知通道。计算机视觉模型,音频处理模型

4.大模型的工作流程(IO)
4.1分词化 与 词表 映射
更具词粒度 和 字符粒度 和 子词粒度 将其分解为更小的粒度
词根的映射,就是说,将一个单词映射成一个元素的 token id,这是token的"身份证",实际上给了一串数字
然后根据概率进行补全后面的单词。
比如 lark is a __ 根据最后的概率来进行填写最后一个单词

5.大模型的应用
同义千问的官网去寻找

 

可以添加官方微信【LarkMidTable2021】,群为VIP群,需要赞助10元才可以添加 , 添加时备注【AI】,可以参与讨论AI啦!

posted @   LarkMidTable  阅读(107)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
点击右上角即可分享
微信分享提示