【人人懂AI】用chatGPT学会大模型GPT
1. 一句话掌握最新关键知识点
1.1 什么是chatGPT?
chatGPT是基于OpenAI公司的人工智能大模型GPT系列开发出的一个网页版的对话机器人。用户可以在网页登录与chatGPT进行语言交流,支持多种主流语言,chatGPT与传统大的智能对话机器人不同,它可以几乎接近人类的理解和表达能力,在对话中扮演会说话的维基百科的角色。
chatGPT官网地址:https://chat.openai.com/chat
1.2 什么是GPT大模型
chatGPT这么强大的理解力,和生成自然语言进行对话的能力,依托于它的内核,OpenAI公司的GPT系列大模型(GPT3.5,GPT4)。
GPT:Generative Pre-trained Transformer 可以翻译为生成式预训练Transformer大模型,它是Transformer大模型的一种衍生。
1.3 什么是Transformer
简单来说,Transformer是自然语言大模型BERT,GPT中的这个T,它的诞生主要为了解决如何让机器生成的一句话更像人话的问题。
如何做到呢?这里借助了一个Self-Attention(自注意力值)的计算,来计算一句话中不同单词的排列在一起的概率大小
1.4 什么是self attention
Self-attention是一种机器学习中的注意力机制,它可以在输入序列中自动学习每个元素之间的关系,从而更好地理解输入序列。在自注意力机制中,每个元素都可以与序列中的其他元素进行交互,以便更好地捕捉序列中的上下文信息。自注意力机制通常用于自然语言处理任务,如机器翻译、文本分类和语言建模等。在自注意力机制中,每个元素都可以与序列中的其他元素进行交互,以便更好地捕捉序列中的上下文信息。
1.5 什么是fine-tune
Fine-tune是指在已经训练好的模型基础上,进一步调整模型参数以适应特定任务或数据集的过程。在机器学习中,通常使用预训练模型来加速和改善模型的训练过程。预训练模型是在大规模数据集上进行训练的,例如自然语言处理任务中的BERT模型或计算机视觉任务中的ResNet模型。 当我们面临一个新的任务或数据集时,可以使用预训练模型作为起点,然后通过fine-tune来调整模型的参数,使其适应特定的任务需求。
Fine-tune的过程通常包括以下几个步骤:
1. 冻结预训练模型的大部分参数:为了保留预训练模型的知识,我们通常会冻结预训练模型的大部分参数,只允许少量参数进行调整。
2. 添加新的任务特定层:根据具体任务的需求,在预训练模型的顶部添加一些新的层,这些层将针对特定任务进行训练。
3. 重新训练模型:使用新的任务数据集对整个模型进行训练,包括预训练模型的部分参数和新添加的任务特定层。 通过fine-tune,我们可以在相对较少的数据和计算资源下,快速构建和训练适应特定任务的模型。这种方法在自然语言处理、计算机视觉和其他领域中都得到了广泛应用。
1.6 什么是prompt(提示词工程)
Prompt(提示词工程)是指在使用AI语言模型时,为了引导模型生成特定类型的回答或完成特定任务,给模型提供的输入文本。Prompt可以是一个问题、一个陈述或一个指令,它的目的是为了指导模型生成符合预期的回答。
通过设计合适的Prompt,可以引导模型生成特定领域的回答,或者完成特定的任务,例如翻译、摘要、对话等。
Prompt的设计需要考虑清晰明确的语言,避免模糊或歧义的表达,以确保模型能够正确理解并生成预期的回答。 在使用AI语言模型时,合理设计和使用Prompt可以提高模型的效果和准确性,使得模型更好地满足用户的需求。
同时,Prompt的设计也需要根据具体的模型和任务进行调整和优化,以获得更好的结果。
2. GPT可以用在什么场景
2.1 辅助内容生成 - 微软Copilot
Microsoft 365 Copilot将无缝集成在用户每天使用的应用当中,帮助他们保持工作的流畅性,从繁琐事务作中解放出来,从而专注于手头工作。
- Copilot in Word能够在人们工作时与他们一起撰写、编辑、总结和创作。
- Copilot in PowerPoint能够在创作过程中,通过自然语言命令将想法转化为设计好的演示文稿。
- Copilot in Excel 能够帮助用户释放洞察、识别趋势,或在短时间内创建专业型式的数据可视化。
- Copilot in Outlook能够帮助用户整合并管理收件箱,从而节约出更多时间用于实际沟通。
- Copilot in Teams能够直接从对话上下文中提供实时摘要和待办事项,提高会议效率。
- Copilot in Power Platform通过在Power Apps和Power Virtual Agents中引入两项新功能,能够让各种技能水平的开发人员利用低代码工具加速和简化开发。
- Business Chat汇集了来自文档、演示文稿、电子邮件、日历、笔记和联系人的数据,能够帮助用户总结聊天内容、撰写电子邮件、查找关键日期,甚至根据其他项目文件制定计划。
3. 安全与隐私如何保障
4. 是否支持私有化部署
5. 希望学习更多专业知识
5.1 内网知识社区
5.2 外部优秀知识直达
5.2.1 微软Azure AI课程(适合初学小白)
https://learn.microsoft.com/zh-cn/training/paths/get-started-with-artificial-intelligence-on-azure/
5.2.2 Google生成式AI课程(科普级大模型课程)
https://www.cloudskillsboost.google/journeys/118
5.2.3 鲁老师的机器学习基础知识合集(进阶学习)
https://lulaoshi.info/machine-learning/attention/transformer-attention.html
5.2.2 芦苇的机器学习笔记(进阶学习)
https://luweikxy.gitbook.io/machine-learning-notes/
5.2.3 大语言模型(LLM)微调技术笔记 #92(高难度进阶学习)
https://github.com/ninehills/ninehills.github.io/issues/92
本文来自博客园,作者:易先讯,转载请注明原文链接:https://www.cnblogs.com/gongxianjin/p/17468276.html