[网摘实践]基于本地部署DeepSeek+VSCode+Cline编写代码
前面的本地部署部分,我已经搭建好了。可以参考:https://www.cnblogs.com/haochuang/p/18700495
这里只是在本地基于模型搭建代码编写相关组件
使用deepseek-r1 + Vscode + Cline/Continue 构建本地代码编辑器
这个落地方案是实现本地代码编辑器,但是具体的效果见仁见智,prompt使用的好的话还是挺不错的。主要的好处就是本地搭建的大模型可以很好的保护隐私。本文提供了两种方案,一个是deepseek-r1 + Continue的方案,另一种是deepseek-r1 + Cline的方案。
1.deepseek-r1 + Vscode + Continue
在Vscode中下载 Continue插件
配置Continue
在config.json文件中,models中加入我们下载好的deepseek-r1模型,配置可以参考如下
1 2 3 4 5 6 7 8 9 10 11 12 | { "model" : "deepseek-r1:14b" , "title" : "deepseek-r1:14b" , "provider" : "ollama" , "systemMessage" : "You are an expert software developer. You give helpful and concise responses." }, { "model" : "deepseek-r1:8b" , "title" : "deepseek-r1:8b" , "provider" : "ollama" , "systemMessage" : "You are an expert software developer. You give helpful and concise responses." } |
然后可以在左侧的对话框中选择配置好的模型了。
最后测试一下,参考 Prompt 如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 | **资深深度学习专家**:你是一名拥有10年深度学习开发经验的人工智能专家,并且专注于时序序列领域,尤其是股票预测方向。 ### 目标 - 复现一个Transformer模型,并且能够通用的在时序序列数据上使用(主要是股票数据)。生成预测数据与真实对比的图像。 ### 技能 - 擅长使用Vscode编程,使用python语言,并且能够进行代码调试。 - 擅长模型参数调试,知道如何调试模型并选取优秀的参数。 - 擅长本地环境搭建 ### 工作流程 模型设计: 1. 设计Transformer模型组件Attention 2. 设计Transformer模型的encoder 3. 设计Transformer模型的decoder 4. 设计Transformer模型model 5. 上面提到的模型文件分别用.py文件存储,然后统一放在src下的models文件夹中 6. 模型参数: - 嵌入维度:32,64 - 注意力头数:8,4 - 注意力层数:2,1 - 学习率:0.001,0.01 预处理: 1. 对于给定的数据(csv文件)进行预处理,删除字符和日期这类特征。 2. 将数据进行归一化,然后进行分批(batch)输入到模型中 3. 归一化提供Z-score标准化、Min-Max标准化或不使用标准化三种方法 4. 训练集和测试集比例为8:2,使用滑动窗口,默认使用7天预测下一天的数据 5. 数据放在src文件夹下的data文件夹中 模型训练: 1. 设计不同的参数进行训练 2. 设计模型训练,epoch为100-200 3. 使用Adam optimizer。 4. 早停条件,监控验证集损失,当连续若干epoch损失不再下降时停止训练。 5. 为模型设计中的参数设置不同组合,以寻找最佳配置 结果保存: 1. 绘图使用python的matplotlib库 2. 预测的值用橙色线画出,真实值用蓝色画出 3. 将不同的参数设置为图片名进行保存 4. 将最终的MSE、MAE、R2、MAPE的结果保存到csv中,上面指标为纵轴,横轴为模型中的参数。 5. 结果统一放在src下的result中,图片放在/src/result/figures,结果放在/src/result/data ### 定义 - Transformer表示人工智能自然语言处理(Natrual Language Process)领域中的论文《Attention is All you Need》中提出的模型Transformer。 ### 约束条件 - 确保代码不用于非法金融活动,如操纵市场 - 主机配置: 1. cpu:amd r3-3100 2. gpu:RTX3060 8g 3. SYSTEM:win11 4. MEMORY: 16G ### 描述 ### 输出格式 1. 首先生成模型的目录结构 2. 然后生成对应的模型文件 3. 如果模型无法运行,需要自动debug(调试) ### 初始化 你是一名拥有10年深度学习开发经验的人工智能专家,并且专注于时序序列领域,尤其是股票预测方向,请以专业和创新的视角思考问题。 |
由于输出太长了,仅展示部分输出。
2.deepseek-r1 + Vscode + Cline
首先是安装Cline插件
配置信息可以参考
API选择 Ollama,指令这里我只设了一个简单的“使用中文回答问题”。
使用Prompt和Continue测试的Prompt一致,部分结果展示如下
这方面最近大神们写了很多文章,也可以参考如下:
摘自:https://blog.csdn.net/weixin_44555174/article/details/145359573
参考:https://cloud.tencent.com/developer/article/2492324
模型配置:https://www.163.com/dy/article/JNE0IDB80519EA27.html
使用技巧:https://blog.csdn.net/datawhale/article/details/145384882
使用技巧:https://www.cnblogs.com/tangshiye/p/18696818
deepseek V3 和 R1 的区别:https://cloud.tencent.com/developer/article/2493335

赠人玫瑰
手留余香
我们曾如此渴望命运的波澜,到最后才发现:人生最曼妙的风景,竟是内心的淡定与从容……我们曾如此期盼外界的认可,到最后才知道:世界是自己的,与他人毫无关系!-杨绛先生
如果,您希望更容易地发现我的新博客,不妨点击一下绿色通道的
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
2018-02-06 【医疗行业】关于dcm4che DICOM Toolkit:C-Move与C-Get