大模型读书报告

                                                                大模型读书报告

大模型是指具有庞大的参数规模和复杂程度的深度机器学习模型,通常指具有数百万到数百亿参数的神经网络模型。大模型的设计和训练旨在提供更强大、更准确的模型性能,展现出类似人类的归纳和思考能力。狭义上,大模型指基于深度学习算法进行训练的自然语言处理模型,主要应用于自然语言理解和生成等领域,广义上,大模型还包括机器视觉大模型、多模态大模型和科学计算大模型等。
ChatGPT是大模型的典型代表,它展现极高的当代人工智能水平,最关键地,ChatGPT提供以文本形式交互的不间断服务,成为当代信息技术的一个重要基础设施,与搜索引擎的作用相似,提供大搜索、智能辅助等基本服务。ChatGPT的诞生意义不亚于互联网的出现。
大模型源于人工智能发展,主要经历了3个阶段:萌芽期、沉淀期和发展期。
萌芽期主要在1950年到2005年,诞生了以CNN为代表的传统神经网络模型。
沉淀期主要在2006年到2019年,诞生了以Transformer为代表的全新神经网络模型。
发展期主要从2020年至今,诞生了一大批以GPT为代表的预训练大模型。
现在市面上常见的大模型有文心一言、豆包、DeepSeek等等。它们能够生成图像、生成中文内涵创意、进行古风格诗词创作、辨别文字陷阱等。
大模型能够帮助调试、优化代码,帮助学习编程。但是大模型在编程方面有自动、快速、调试的优势,同时也有无法验证、不能建库、不懂系统的劣势。所以大模型编程只能作为辅助的工具,尚不能自主编程。
所以作为学习编程的人,需要学习好基本编程,再用好大模型辅助。这样才能创造出好的程序。

posted @   qywywq  阅读(7)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)
点击右上角即可分享
微信分享提示