01 2025 档案

摘要:一、基本概念 1. Prompt Prompt 最初是 NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种 Prompt。在 ChatGPT 推出并获得大量应用之后,Prompt 开始被推广为给大模型的所有输入。即,我们每一次访问大 阅读全文
posted @ 2025-01-31 21:46 久曲健 阅读(115) 评论(0) 推荐(0) 编辑
摘要:一. 什么是LLM(大语言模型)? 1. 发展历程 语言建模的研究始于20世纪90年代,最初采用了统计学习方法,通过前面的词汇来预测下一个词汇。然而,这种方法在理解复杂语言规则方面存在一定局限性。 随后,研究人员不断尝试改进,其中在2003年,深度学习先驱Bengio在他的经典论文《A Neural 阅读全文
posted @ 2025-01-30 21:54 久曲健 阅读(158) 评论(3) 推荐(0) 编辑
摘要:写在前面 最近,DeepSeek 发布的推理大模型 DeepSeek - R1 ,可以说是AI大模型领域杀出的一匹黑马。它在国外大模型排名 Arena 上成绩惊人,基准测试位列全类别大模型第三,在风格控制类模型中更是与 OpenAI o1 并列第一。不仅如此,1 月 27 日,其应用登顶中美应用商店 阅读全文
posted @ 2025-01-28 17:44 久曲健 阅读(20732) 评论(2) 推荐(7) 编辑

点击右上角即可分享
微信分享提示