该文被密码保护。 阅读全文
posted @ 2025-04-10 16:57 supermao12 阅读(0) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2025-04-09 22:07 supermao12 阅读(0) 评论(0) 推荐(0)
摘要: wrp wrp开启一个了一个服务器代理,将Web内容转换为适合特定设备或平台的格式,以提高内容的兼容性和性能。 网页将在wrp服务器进行渲染,返回给请求服务器以降低请求服务器的压力。 https://github.com/tenox7/wrp/releases/tag/4.8.2 更改源代码 wrp 阅读全文
posted @ 2025-03-31 15:37 supermao12 阅读(22) 评论(0) 推荐(0)
摘要: Linux通过huggingface安装大模型 huggingface官网 https://huggingface.co/ wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/minicond 阅读全文
posted @ 2025-03-27 08:37 supermao12 阅读(231) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2025-03-16 21:50 supermao12 阅读(0) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2025-03-15 21:28 supermao12 阅读(0) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2025-03-12 14:30 supermao12 阅读(0) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2025-03-06 22:06 supermao12 阅读(1) 评论(0) 推荐(0)
摘要: 提示工程-RAG-微调 工程当中也是这个次序 提示词工程 RAG 微调 先问好问题 再补充知识 最后微调模型 RAG相关技术细节 选择合适的 Chunk 大小对 RAG 流程至关重要。 Chunk 过大:检索精度下降、浪费 Prompt(token) 空间;过小:信息太碎、检索和拼接(embeddi 阅读全文
posted @ 2025-03-06 22:04 supermao12 阅读(300) 评论(0) 推荐(0)
摘要: ollama查看模型 C:\Users\DK>ollama show deepseek-r1:7b Model architecture qwen2 parameters 7.6B context length 131072 embedding length 3584 quantization Q4 阅读全文
posted @ 2025-03-02 08:08 supermao12 阅读(716) 评论(7) 推荐(0)