大模型读书报告

                                                                大模型读书报告

大模型是指具有庞大的参数规模和复杂程度的深度机器学习模型，通常指具有数百万到数百亿参数的神经网络模型。大模型的设计和训练旨在提供更强大、更准确的模型性能，展现出类似人类的归纳和思考能力。狭义上，大模型指基于深度学习算法进行训练的自然语言处理模型，主要应用于自然语言理解和生成等领域，广义上，大模型还包括机器视觉大模型、多模态大模型和科学计算大模型等。
ChatGPT是大模型的典型代表，它展现极高的当代人工智能水平，最关键地，ChatGPT提供以文本形式交互的不间断服务，成为当代信息技术的一个重要基础设施，与搜索引擎的作用相似，提供大搜索、智能辅助等基本服务。ChatGPT的诞生意义不亚于互联网的出现。
大模型源于人工智能发展，主要经历了3个阶段:萌芽期、沉淀期和发展期。
萌芽期主要在1950年到2005年，诞生了以CNN为代表的传统神经网络模型。
沉淀期主要在2006年到2019年，诞生了以Transformer为代表的全新神经网络模型。
发展期主要从2020年至今，诞生了一大批以GPT为代表的预训练大模型。
现在市面上常见的大模型有文心一言、豆包、DeepSeek等等。它们能够生成图像、生成中文内涵创意、进行古风格诗词创作、辨别文字陷阱等。
大模型能够帮助调试、优化代码，帮助学习编程。但是大模型在编程方面有自动、快速、调试的优势，同时也有无法验证、不能建库、不懂系统的劣势。所以大模型编程只能作为辅助的工具，尚不能自主编程。
所以作为学习编程的人，需要学习好基本编程，再用好大模型辅助。这样才能创造出好的程序。