【Datawhale】4月AIGC-ChatGPT从入门到应用
Datawhale https://datawhale.club/ 48期组队学习
https://datawhaler.feishu.cn/docx/MNHBdr7hqoEdNexMoi2cbYpcnTe
Datawhale是谁?
Datawhale是一个专注于数据科学与AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。
Datawhale以【for the learner,和学习者一起成长。】为使命,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。
同时Datawhale用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人、人与知识、人与企业和人与未来的联结。
AIGC时代以来,本教程为Datawhale团队设计AIGC系列专题中的GPT-Prompt教程,希望通过本课程帮助所有学习者更好地利用GPT等生产力工具来提高自身的学习与工作效率,适应新的时代。
本教程虽然叫做【GPT】教程,但内容同样适用于【文心一言】等基于GPT的AI产品。
本教程适用于各种受众,包括但不限于开发人员、研究人员、产品经理和对AI聊天机器人感兴趣的个人。
如果你是想了解GPT的高阶使用(应用开发实战)等,可学习高阶使用课程。
基础使用
1 GPT导论
1.1 ChatGPT介绍
ChatGPT是基于GPT(Generative Pre-trained Transformer)的聊天型AI模型,由OpenAI团队开发。它的核心是GPT模型,这是一种基于Transformer的神经网络模型,能够对文本进行自动编码和生成。
技术背景
GPT-4架构:GPT-4是OpenAI的一种大型预训练语言模型,是GPT系列的第四代。GPT-4在大量文本数据上进行训练,使其具有强大的理解和生成语言的能力。GPT-4架构基于自注意力和Transformer结构,有效处理长距离依赖和复杂语义关系。
Transformer:Transformer是一种深度学习模型,基于自注意力机制,可以并行处理输入序列中的所有单词。相较于传统的循环神经网络(RNN)和长短期记忆网络(LSTM),Transformer具有更高的计算效率和表现力。
【【Transformer模型】曼妙动画轻松学,形象比喻贼好记】 https://www.bilibili.com/video/BV1MY41137AK/?share_source=copy_web
Transformer 模型详解 https://blog.csdn.net/benzhujie1245com/article/details/117173090
自注意力:自注意力机制是Transformer的核心组件,它可以识别输入序列中各个单词之间的关系。自注意力通过每个单词分配权重来计算上下文相关的表示,是模型能够捕捉长距离依赖和复杂语义关系。
训练过程
ChatGPT的训练分为两个阶段:预训练和微调。
预训练:在预训练阶段,模型在大量的文本数据上进无监督学习。这些数据包括网页、书籍、文章等,来源广泛且多样。模型通过学习这些数据,掌握语言的结构和语义知识。
微调:在微调阶段,模型使用有标签的数据进行监督学习。这些数据包括对话、问题回答等,帮助模型更好地适应特定任务和场景。微调使模型能够更准确的理解和生成目标领域的语言。
应用场景
ChatGPT可以应用于各种场景,包括:问题回答、文本生成、情感分析、摘要生成、机器翻译、代码生成、教育辅助、客户支持等。
局限性与挑战
尽管ChatGPT具有很高的准确性和灵活性,但它仍然存在一些局限性和挑战:数据偏见、知识时效性、不准确的回答、欠缺解释能力、安全隐患。
未来发展
随着AI技术的不断发展,ChatGPT及其衍生模型将在以下方面取得进步:模型规模、训练数据、微调和适应性、可解释性、安全性和伦理、节能和可持续性。
GPT发展历史
2018年,GPT-1,使用了12层Transformer编码器,并训练了40亿个单词的语料库,1.17亿参数。用于预测下一个单词,使其能够生成自然语言文本。算得上一个还算不错的语言理解工具而非对话式AI。
2019年,GPT-2,使用了48层Transformer编码器,并训练了80亿个单词的语料库,15亿参数。学习目标则使用无监督预训练模型做有监督任务。除了理解能力外,在生成方面第一次表现出了强大的天赋。
2020年,GPT-3,使用了1750亿个参数,是当时最大的神经语言模型之一。作为一个无监督模型(自监督模型),几乎可以完成自然语言处理的绝大部分任务。似乎让人们看到了通用人工智能的希望。
2022年,InstructGPT。是一个更真实、更无害,更好地遵循用户意图的语言模型,经过微调的新版本GPT-3,可以将不真实的、有害的和有偏差的输出最小化。
2022年,ChatGPT。每走一步,都会观察人类的反馈,重点是能更好的分析人类的意图。
2023年,GPT-4,参数未知。一个大型多模态模型(LMM,Large Multimodal Model),能够接受图像和文本输入,并输出文本。
【延展阅读】
1、【GPT-4】GPT-4 相关内容总结 https://blog.csdn.net/liluo_2951121599/article/details/129544327
2、【【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型】 https://www.bilibili.com/video/BV1MY4y1R7EN/?share_source=copy_web
未来影响总结:
ChatGPT的革命意义是向人们展示了【大语言模型的可行性】;
人类群体通过语言处理来实现【知识的创造、继承和应用】;
机器处理语言有着速度快、记忆大、覆盖广、无疲劳的优点;
大语言模型能够减轻语言处理工作,改变人与人、人与机器的协作方式;
人类的理解和机器的理解不同,语言模型不知道符号的指代;
大语言模型对社会的未来影响,相当于口语、文字、电脑、互联网对社会的影响;
对教育界、学术界、新闻界、内容生成行业的影响颇深;
它将方便人类对既有知识的继承,推进教育去培养高层次人才;
也将带来网络安全和社会安全的新挑战。
OpenAI介绍
OpenAI主要关注的重点是创造AGI(通用人工智能)并确保AGI造福人类。保持合作的意愿,避免竞争。OpenAI会将其研究的内容进行开源分享,让更多的人拥有和使用AI,以将最大限度地造福全人类的方式,发展人工智能。
2015 年 12 月,Elon Musk、Sam Altman 和其他投资者宣布成立OpenAI。总部位于美国加州旧金山,OpenAI 旨在确保通用人工智能造福全人类。
2016 年 4 月 27 日,OpenAI 发布了其强化学习研究平台"OpenAI Gym"的公测版。
2016 年 12 月 5 日,OpenAI发布了"Universe",这是一个软件平台,用于测量和训练人工智能在全球游戏、网站和其他应用程序中的通用智能。
2018 年 2 月 21 日,马斯克辞去了董事会席位。
2019 年,OpenAI 从非营利性转变为"有上限"的营利性。该公司将股权分配给其员工,并与微软公司合作,后者宣布向该公司投资 10亿美元。 OpenAI 随后宣布打算对其技术进行商业许可,微软是其首选合作伙伴。
2019年7月22日,微软投资OpenAI10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。
2020 年 6 月,OpenAI 发布了GPT-3,这是一种基于互联网上数万亿个单词训练的语言模型。微软于2020年9月22日取得GPT-3独家授权。
2021 年 1 月,OpenAI 推出了 DALL-E。 一年后,他们的最新系统 DALL·E 2 以4 倍的分辨率生成更逼真、更准确的图像。
2022年11月30日,OpenAI发布了一个名为ChatGPT的自然语言生成式模型,它以对话方式进行交互。
2023年1月5日,OpenAI正在谈判以收购要约的形式出售现有股份,交易对该公司的估值达到290亿美元左右,使其在没有什么收入的情况下成为账面上最值钱的美国初创公司之一。
2023年1月10日,微软正考虑对OpenAI进行100亿美元的投资;OpenAI是爆红的ChatGPT聊天机器人的创造者。微软此前已经在2019年向OpenAI投资了10亿美元,目前正尝试在其必应(Bing)搜索引擎和微软设计应用中执行这款人工智能软件。
2023年2月1日,OpenAI公司宣布,新的订阅服务名为ChatGPTPlus,月费为20美元。订阅包括在高峰使用时间访问聊天机器人。新的订阅计划将在未来几周内首先在美国推出,然后扩展到其他国家。
2023年3月15日,OpenAI发布GPT-4。
1.2 Prompt简介
什么是Prompt?
prompt,简单的理解它是给AI模型的指令。
任何你希望解决的问题通过文字形式表达出来,作为Prompt传递给AI模型(在ChatGPT等GPT产品中目前是文字形式,未来可能有图像,语音、视频等多形式),AI模型会基于prompt所提供的信息,生成对应的文本、图片甚至视频等信息。
比如,在ChatGPT里最下方的对话框Send a message...处,这里就是我们输入Prompt的位置,所输入的内容就是Prompt。
比如,在文心一言中,最下方的对话框请输入问题或“/”获取模版处,这里就是我们输入Prompt的位置,所输入的内容就是Prompt。
什么是Prompt Engineering?
Prompt engineering是指通过对GPT模型输入的Prompt进行精心设计和调整,来控制模型的生成输出结果。一般包括如下几个方面:
设计合适的Prompt
调整Prompt的长度和内容
引导模型生成特定内容
调整模型参数
通过以上的内容,大家应该能感受到如何通过Prompt用好GPT生产力工具就是Prompt Engineering的价值。
2023年2月,OpenAI的CEO Sam Altman表示,学会Prompt是个高杠杆技能。2023年3月,李彦宏也表示十年后不会写提示词或被淘汰。
2 Prompt基本用法
2.1 基本用法简述
1、使用ChatGPT前要做的3个准备
1.1认知上
1)超级学霸,几乎所有的工作/生活场景,都可以找它帮忙;
2)只有2021年9月及以前的数据,时效性可能会跟不上。
1.2心态上
1)拥抱ChatGPT,学会用它来为自己赋(gan)能(huo);
2)它很强大,如果使用时觉得它有问题,很可能是自己没有掌握正确使用它的姿势。
1.3使用上
1)前期使用它时整体效率会下降,但懂了它之后,效率会成倍提升;
2)四个要点:提示词/持续调教/角色扮演/英文环境。
2、ChatGPT使用要点
2.1提示词
1)清晰
2)聚焦
3)相关
2.2持续调教
https://wsbj757q14.feishu.cn/docx/TUq1dGevNo4mQ4x1tjzc1Nlpnhh
1.明确提问
2.逐步优化问题
3.指导性问答
4.分阶段提问
5.使用关键词
6.反馈与评价
7.多次尝试
2.3角色扮演
当我们以特定角色来提问时,ChatGPT会根据这个角色的知识和经验来回答问题。这有助于生成更专业、更具针对性的回答。
2.4英文环境
由于ChatGPT的训练数据英文内容比中文内容更加丰富,所以在英文场景下,ChatGPT通常能够更好地理解上下文和提供准确的回答。
3、个人可以怎么使用ChatGPT?
3.1问答助理
3.1.1深入研究某个知识板块
提示词:(有啥问题直接问就好,问题要清晰、聚焦、相关),问完之后继续有针对性地提问。
3.1.2信息收集
提示词:有哪些/哪几个;继续。
3.1.2咨询教练
提示词:你说一名法律专家(心理咨询师/企业咨询师...),我遇到的问题是:XXX
3.2创作(写作/短视频等)
3.2.1灵感激发
提示词,如下图所示,图片来自网络。
还可以深挖。
3.2.2素材寻找(金句/案例)
提示词:帮我找一个XX(数据驱动增长)的案例,要求是:国内的互联网公司,2020年之后的案例。
3.2.3语言润色
提示词:把上面这段文字润色一下,要求:要通俗易懂、结构清晰、主题明确,同时有一些细节描写,并且有一些例子。
3.2.4文案(or脚本)撰写
提示词:你是一个文案大师,你现在需要撰写XXX的宣传文案,面向用户的特点是:XXX,文案的要求是:XXX。请写出10个XXX的宣传文案。
3.2.5标题优化
提示词:把这个标题润色一下,要求:吸引人,让人看到的第一眼就可以被吸引到,同时要通俗,10岁的孩子也能看明白。10~15字。按照这个要求写10条。
3.3写代码&改BUG
提示词:使用Python(编程语言)做xx事,并附上代码。
把报错信息返回给GTP-4,它会根据报错信息重新生成。来回调整几轮,就可以得到可运行的目标代码啦。
4、文本生成AI提示词高阶玩法
Instruction(必须): 指令,即你希望模型执行的具体任务。
Context(选填):背景信息,或者说是上下文信息,这可以引导模型做出更好的反应。
Input Data(选填): 输入数据,告知模型需要处理的数据。
Output Indicator(选填):输出指示器,告知模型我们要输出的类型或格式。
5、一些基于ChatGPT的拓展
5.1ChatGPT+PDF(ChatDOC)
https://chatdoc.com/chatdoc/
可以导入PDF文档,基于PDF进行有目的性地学习。对于我这种英文读起来比较慢的人,读英文材料会轻松很多。
5.2ChatGPT+Excel
可以让ChatGPT写VBA,然后嵌入到Excel中运行,感兴趣的小伙伴可以自行探索一下。
5.3ChatGPt+用户评价(卖货公司需要...)
把自己公司(消费品牌公司)的商品评价数据全部通过API接口喂进ChatGPT,然后让ChatGPT给出正负向评价打标。
5.4ChatGPT+私董会
告诉ChatGPT要开一个私董会,私董会的人选有:乔布斯、马斯克等,然后把自己的问题放进去,让ChatGPT站在几个名人的角度给建议和策略。
5.5ChatGPT生成思维导图
让ChatGPT 生成某本书/某篇文档的思维导图,
1)给chatgpt下指令说用markdown格式输出某一主题的内容
2)内容到你满意后,复制到txt里,再把txt的扩展名该成md
3)打开xmind,随便新建一个导图,点击文件---导入markdown格式,选择刚才保存的txt即可
5.6ChatGPT生成流程图
https://mp.weixin.qq.com/s/GXXh0jOdpAIv1QDc8DM5zA
5.7喂给ChatGPt某个特定主题/大牛的资料
需要研究某个领域的学习内容,就把相关的资料全部喂给它,然后让ChatGPT基于资料生成回答。
5.8ChatGPt+SQL
可以使用ChatGPT写SQL语句,优化SQL性能等。
5.9导出ChatGPT对话记录的差距
ChatGPT to Markdown / ChatGPT Save Data :谷歌应用商店下载
6、一些很棒的关于ChatGPT使用的资料
1、万字干货!ChatGPT 从零完全上手实操指南! https://mp.weixin.qq.com/s/v425BWzCqQUu75G8pagYBQ
2、最近很火的 ChatGPT 究竟是什么?会给我们的生活带来什么改变? https://mp.weixin.qq.com/s/GkUPpftkv5fS6qHMZm8ZuA
1)ChatGPT 是什么?
2)ChatGPT 能做什么?
3)ChatGPT 的缺点和问题
4)ChatGPT 的未来前景
5)微调:训练你自己的人工智能
6)ChatGPT 会替代什么岗位?
7)结语
3、AI会让我们失业吗?一文讲清AI的前景、影响和可能性 https://mp.weixin.qq.com/s/V4tYUwSFa9QsdawySaqptQ
2023年第一个季度,是属于AI的。随着ChatGPT、New Bing、GPT-4、Google Bard、MidJourney v5、Adobe Firefly……一系列名字的横空出世,许多人终于开始理解和接受这个事实:AI离我们并不遥远,它正在改变我们的世界。
摆在我们眼前的事实是:MidJourney 和 Stable Diffusion 经过调校和控制,已经能够生成几可乱真的 AI 绘画,甚至能够模拟照片。人类引以为豪的审美能力,在 AI 面前,不过是一群遵循某种模式的噪点而已。
我们目前所实现的AI,包括在可见的未来能够实现的AI,实际上都不是AGI(Artificial General Intelligence,通用人工智能),而是工具型的AI。
什么是通用人工智能呢?简单来说,就是像人类一样,能够进行独立思考,理解所处的情境,应对人类面对的一般问题的 AI,也就是科幻作品里常见的 AI。如果这类 AI 出现,那么必然会替代绝大多数工作,引起前所未有的变革,这是毫无疑问的。
只要这个社会依然存在高度的分工,就一定存在大量的需求可以被满足。
也就是说:AI 所带来的不是失业,而是让整个社会的价值交换更细致、更有效了。
直观的感受,就是整个世界变得更「快」和更「精准」了:许多产品可以得到更快的更新迭代,许多小而美的产品可以被创造出来,许多小众的需求可以被看见、得到关注和满足,许多停留在构思里的事物,可以得到实现……
届时,我们的触角和可能性会被大大延伸。我们可以把大量繁琐的、重复的日常工作交给 AI,腾出更多的时间,去学习新事物、新技术,思考新方向、新点子,探索新的可能,新的人生。
所以,面对 AI 的浪潮,我的观点一直都是这几点:
1)专精自己的优势和专业领域,不断提高自己的专业水平。
2)思考如何把 AI 应用到自己的专业中,提高自己的产出和效率。
3)不断接收新信息、拥抱新变化,拓展自己的视野,接触更多的人和行业,思考能够跟自己碰撞出什么新的火花。
而从社会整体的角度,同样有一个不容忽视的隐患:那就是社会对个体的剥削、异化和规训。
整个社会链条可能运转得更快、更顺畅,但它带来的效果,可能更多地聚集在富人身上。而负担社会链条运转的负荷的,可能是你,是我,是我们每一个人。
4、【【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型】 https://www.bilibili.com/video/BV1MY4y1R7EN/?share_source=copy_web