随笔分类 - AI大模型
摘要:《DeepSeek从入门到精通2025》是由清华大学元宇宙文化实验室的余梦珑博士后及其团队撰写。文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开,帮助用户从入门到精通DeepSeek的使用。 以前我看了很多教程,都感觉特别花哨,没啥干货
阅读全文
摘要:大家好,我是六哥。 由于DeepSeek真的太火了,也许你也跟我一样,常会遇到这样的情况: 真的让人抓狂,10条回复里常常有9条是“服务器blabla,请稍后重试”,看到这话,就问你,谁能不崩溃? 其实仔细想想,DeepSeek的目标是AGI,算力资源更多用在探索模型上,很难兼顾几亿用户的推理需求。
阅读全文
摘要:大家好,我是六哥,今天还是我们喜爱的DeepSeek的玩法,今天来个实战案例,和大家分享一下如何将DeepSeek接入VS Code,结合AI Toolkit插件完成自动化脚本的实战开发。 一、准备 微软官方为我们提供了一个针对AI辅助的插件——AI Toolkit for Visual Studi
阅读全文
摘要:大家好,我是六哥,欢迎来到今天的技术分享!今天我要给大家带来一个超实用的教程,教你如何使用PyCharm接入DeepSeek R1实现AI编程。就算你是编程小白,也能轻松搞定,话不多说,让我们开始吧! 一、为什么要在本地搭建DeepSeek R1模型? 在开始搭建之前,先和大家聊聊这样做的好处,让你
阅读全文
摘要:highlight: a11y-dark theme: channing-cyan 五、调用智谱 AI 1. ChatGLM 大模型 智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度
阅读全文
摘要:一、基本概念 1. Prompt Prompt 最初是 NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种 Prompt。在 ChatGPT 推出并获得大量应用之后,Prompt 开始被推广为给大模型的所有输入。即,我们每一次访问大
阅读全文
摘要:一. 什么是LLM(大语言模型)? 1. 发展历程 语言建模的研究始于20世纪90年代,最初采用了统计学习方法,通过前面的词汇来预测下一个词汇。然而,这种方法在理解复杂语言规则方面存在一定局限性。 随后,研究人员不断尝试改进,其中在2003年,深度学习先驱Bengio在他的经典论文《A Neural
阅读全文
摘要:写在前面 最近,DeepSeek 发布的推理大模型 DeepSeek - R1 ,可以说是AI大模型领域杀出的一匹黑马。它在国外大模型排名 Arena 上成绩惊人,基准测试位列全类别大模型第三,在风格控制类模型中更是与 OpenAI o1 并列第一。不仅如此,1 月 27 日,其应用登顶中美应用商店
阅读全文