随笔分类 - AI / LLM

数据不出内网：基于Ollama+OneAPI构建企业专属DeepSeek智能中台

摘要：前言之前已经在Linux服务器上使用Ollama部署了DeepSeek 这次在没有外网（应该说是被限制比较多）的服务器上部署，遇到一些坑，记录一下 ollama ollama 自然无法使用在线安装脚本了根据 ollama 的文档先在本地电脑根据服务器的系统和CPU架构下载安装包 curl -L 阅读全文

posted @ 2025-02-18 16:22 程序设计实验室阅读(942) 评论(0) 推荐(0) 编辑

大模型背后的向量魔法：Embedding技术初探

摘要：本文原本是2022年写的，然而一直没有完善😂，自从LLM火起来之后，NLP领域的技术更新很快，本文只是大概介绍了Embedding相关的基础知识，具体应用接下来会在博客更新发布。前言又是很长一段时间没更新博客了，这个暑假非常忙，也稍微做出了一点成果，接下来会继续在博客上分享~ 今年以来，大模型阅读全文

posted @ 2025-02-07 17:21 程序设计实验室阅读(523) 评论(0) 推荐(3) 编辑

DeepSeek火爆全网，官网宕机？本地部署一个随便玩「LLM探索」

摘要：前言最近 DeepSeek 狠狠刷了一波屏，国产大模型真的越来越厉害了👍，官方的服务器已经爆满了，以至于频繁出现反应迟缓甚至宕机的情况，和两年多之前 ChatGPT 的遭遇颇为相似。我已经好久没有本地部署模型了（现在各厂商的模型都便宜量大），这次正好来试试 DeepSeek 开源模型的效果。阅读全文

posted @ 2025-01-30 13:12 程序设计实验室阅读(4576) 评论(0) 推荐(4) 编辑

LLM探索：为ChatGLM2的gRPC后端增加连续对话功能

摘要：前言之前我做 AIHub 的时候通过 gRPC 的方式接入了 ChatGLM 等开源大模型，对于大模型这块我搞了个 StarAI 框架，相当于简化版的 langchain ，可以比较方便的把各种大模型和相关配套组合在一起使用。主要思路还是用的 OpenAI 接口的那套，降低学习成本，但之前为了快阅读全文

posted @ 2023-10-19 11:13 程序设计实验室阅读(434) 评论(0) 推荐(1) 编辑

LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature

摘要：## 前言上一篇文章介绍了几个开源LLM的环境搭建和本地部署，在使用ChatGPT接口或者自己本地部署的LLM大模型的时候，经常会遇到这几个参数，本文简单介绍一下~ - temperature - top_p - top_k ### 关于LLM 上一篇也有介绍过，这次看到一个不错的图 >A rec 阅读全文

posted @ 2023-05-24 11:35 程序设计实验室阅读(2209) 评论(0) 推荐(2) 编辑

LLM探索：环境搭建与模型本地部署

摘要：## 前言最近一直在炼丹（搞AIGC这块），突然发现业务代码都索然无味了… 上次发了篇AI画图的文章，ChatGPT虽然没法自己部署，但现在开源的LLM还是不少的，只要有一块差不多的显卡，要搞个LLM本地部署还是没问题的。本文将介绍这以下两个国产开源LLM的本地部署 - ChatGLM-6B - 阅读全文

posted @ 2023-05-20 11:29 程序设计实验室阅读(2672) 评论(0) 推荐(1) 编辑

公告

昵称：程序设计实验室
园龄： 9年1个月
粉丝： 337
关注： 23

+加关注

2025年2月

日

一

二

三

四

五

六

Loading

程序设计实验室

公众号：程序设计实验室

随笔分类 - AI / LLM

公告

搜索

常用链接

我的标签

合集 (1)

随笔分类 (271)

随笔档案 (252)

网站链接

阅读排行榜

评论排行榜

推荐排行榜

最新评论