随笔分类 -  云运维&&云架构

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 185 下一页

litellm fastapi sse api 集成简单说明
摘要:实际上就是基于litellm+ ollama 对于gemma2 包装一个stream rest api ,以下是一个简单说明 参考玩法 基于litellm 对于ollama 的模型实现proxy,同时增强安全控制能力,ollama 集成了qwen2 、gemma2 以及其他模型 litellm pr 阅读全文

posted @ 2024-08-05 08:00 荣锋亮 阅读(55) 评论(0) 推荐(0) 编辑

litellm 集成instructor 简单说明
摘要:instructor 是一个很不错的llm 结构化输出工具litellm 与instructor 的集成模式实际也包含了两种,一种是基于patch 模式,一种是标准openai 模式,以下简单说明下 patch 模式 import litellm from litellm import Router 阅读全文

posted @ 2024-08-04 07:27 荣锋亮 阅读(40) 评论(0) 推荐(0) 编辑

litellm proxy 模式试用
摘要:litellm 支持灵活的proxy 模式可以更加方便得控制后端llm 以及特性,以下简单说明下 proxy 使用 对于proxy 实际上就是一个api web sever 目前可以通过两种模式运行,一种是直接cli 指定模型的,还有一种是基于配置文件的 对于简单项目基于cli 是比较快速的方法,如 阅读全文

posted @ 2024-08-03 08:00 荣锋亮 阅读(225) 评论(0) 推荐(0) 编辑

superagent ai agent 开发框架
摘要:superagent 是一个ai agent 开发框架 支持的业务场景 基于文档的问答类系统(大模型微调以及向量存储) chatbots co-pilots 以及ai 助手 内容生成 数据聚合 workflow 自动agent 包含的特性 memory 记忆 streaming python 以及t 阅读全文

posted @ 2024-08-02 07:00 荣锋亮 阅读(41) 评论(0) 推荐(0) 编辑

langfuse 开源llm工程平台
摘要:langfuse 是一个开源llm工程平台,提供了可观测性,metrics,评估,提示词管理,playgroud,datasets,可以很好的与llamaindex langchain openai sdk,litellm 以及其他东西集成 说明 langfuse 支持的集成还是很多的,提供了不少语 阅读全文

posted @ 2024-08-01 06:30 荣锋亮 阅读(328) 评论(0) 推荐(0) 编辑

schemacrawler 免费开源的数据库schema 发现以及理解工具
摘要:schemacrawler 是基于java 开发的免费开源的数据库schema 发现以及理解工具 schemacrawler 包含的几个周边 cli 提供了cli 我们可以方便的处理不同数据库的处理,同时支持输出为html,json,yaml java api 通过java api 可以方便的通过p 阅读全文

posted @ 2024-07-31 07:58 荣锋亮 阅读(121) 评论(0) 推荐(0) 编辑

litellm ollama python api 模式测试
摘要:一起简单说过itellm 支持多种模式的大模型运行,有proxy 模式(可以proxy 模型以及包含api服务的模型接口),也有直接通过python 代码进行访问的,以下是对于ollama 模型的一个简单运行试用 python代码模式 appv4.py 此模式litellm 会自己进行 from l 阅读全文

posted @ 2024-07-30 07:13 荣锋亮 阅读(167) 评论(0) 推荐(0) 编辑

litellm openai 标准格式的支持100+ 大模型的负载均衡&异常fallback 框架
摘要:litellm 支持多种大模型的处理包含了负载均衡,fallbabck,速度追踪,配置管理,限速处理,同时对于提供标准的openao 标准格式api基于此我们可以实现大模型标准的openai 能力,同时实现类似openai 的安全管理,key 管理,同时支持多示例的配额管理(基于redis的)同时也 阅读全文

posted @ 2024-07-29 00:42 荣锋亮 阅读(149) 评论(0) 推荐(0) 编辑

通过instructor 对于LLM 进行结构化输出
摘要:很多时候我们是需要对于LLM 生成的内容进行结构化输出的,比如我们希望利用LLM的能力,对于用户发布的内容进行情感分析,或者对于文档内容提取关键信息并转换为结构化的内容,instructor 是一个很不错的选择(支持多种语言的),以下演示下基于python 的 参考使用 大模型部署 为了方便使用了基 阅读全文

posted @ 2024-07-28 08:00 荣锋亮 阅读(98) 评论(0) 推荐(0) 编辑

ollama push 自己的模型
摘要:ollama 模型运行之后会生成ssh key ,我们首先需要在https://ollama.com/ 进行注册账户,然后添加自己的key,之后才能进行push key 的位置 默认一般会有一个~/.ollama/id_ed25519.pub,但是也可能会没有(比如调整了配置)还有一个是在/usr/ 阅读全文

posted @ 2024-07-27 18:11 荣锋亮 阅读(101) 评论(0) 推荐(0) 编辑

ollama llama3.1 8b openbuddy中文模型
摘要:openbuddy 对于 llama3.1 8b 模型进行了少量的中文训练实现了不错的中文理解处理,以下是使用社区提供的gguf 格式,制作一个ollama 新模型 模型制作 下载模型 下载gguf 文件,推荐使用加速工具 Modelfile 参考了llama3.1 的 FROM /home/mod 阅读全文

posted @ 2024-07-27 14:48 荣锋亮 阅读(163) 评论(0) 推荐(0) 编辑

python-rq 简单使用
摘要:python-rq 是一个类似celery 的python 任务调度框架基于了redis 部署 需要包含worker 以及具体的任务执行,或者调度任务尺触发, 同时注意因为依赖redis 应该先启动redis 启动worker rq worker --with-scheduler 任务开发 注意任务 阅读全文

posted @ 2024-07-27 08:00 荣锋亮 阅读(60) 评论(0) 推荐(0) 编辑

fastapi apscheduler 集成简单说明
摘要:对于 fastapi apscheduler 集成以及支持动态添加任务的简单说明 参考使用 依赖 包含了fastapi,apscheduler sqlalchemy uvicorn pip install fastapi apscheduler sqlalchemy uvicorn 代码简单说明 代 阅读全文

posted @ 2024-07-26 08:00 荣锋亮 阅读(62) 评论(0) 推荐(0) 编辑

constructor conda 软件安装包构建工具
摘要:constructor 可以用来方便的进行软件包的构建,目前包含了pkg.exe,sh 可以支持不同的操作系统,以下是一个简单使用 准备conda 环境 命令 conda create -n con constructor // 激活 conda activate con 使用 construct. 阅读全文

posted @ 2024-07-25 08:00 荣锋亮 阅读(21) 评论(0) 推荐(0) 编辑

dbt indexes 配置简单说明
摘要:dbt indexes 索引配置的目的是提升系统性能,为了方便维护dbt 提供了默认空实现,对于不同db 会有不同的实现,以下简单说明下 内部macro 定义 可以看到基本实现都为空,由具体的db adapter 实现 {% macro get_create_index_sql(relation, 阅读全文

posted @ 2024-07-24 07:37 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

ollama 0.2.8 发布
摘要:就在今天ollama 0.2.8 发布了,提供了新的模型mistral-nemo 以及nuextract 的支持,mistral-nemo 是一个新发布的模型,很值得体验下 参考资料 https://ollama.com/library/mistral-nemohttps://ollama.com/ 阅读全文

posted @ 2024-07-23 15:53 荣锋亮 阅读(30) 评论(0) 推荐(0) 编辑

dbt 1.8 发布
摘要:就在最近,dbt 发布了1.8.0 版本,核心比较重要的功能是提供了单元测试的能力,同时是官方文档也进行了调整(以前是可以看到,但是是实际是不能使用的),完整的changelogs 可以查看github 信息 参考资料 https://docs.getdbt.com/reference/resour 阅读全文

posted @ 2024-07-23 08:00 荣锋亮 阅读(14) 评论(0) 推荐(0) 编辑

dbt dremio 自定义的几个macro 简单说明
摘要:关于自定义schema 以前简单说明过,实际上dbt 支持了好几个预留的macro,可以方便进行自定义,比如schema,database,aliases,target dbt dremio adapter 的几个自定义macro 实际上就是上边说的,schemas,aliases,database 阅读全文

posted @ 2024-07-22 08:00 荣锋亮 阅读(20) 评论(0) 推荐(0) 编辑

dbt dremio nessie create table branch 问题解决简单说明
摘要:以前是简单说明过解决方法,以下通过实际代码,说明下解决 dbt dremio 集成nessie 内部处理简单说明 注意目前说明的场景是基于nessie 作为数据库配置的,而不是dbt 标准的space 玩法 整体处理 如下图,实际上和业务模型的定义有关系,包含了view,以及table,当然还有属于 阅读全文

posted @ 2024-07-21 01:21 荣锋亮 阅读(17) 评论(0) 推荐(0) 编辑

dbt create table branch 问题
摘要:属于社区有人的一个提问,实际上dremio 支持对于nessie source 特定branch 的 table 的创建,而且源码也有信息,只是官方文档缺少说明 branch创建表参考测试 一个简单sql CREATE table dbtv4.myappv5 AT BRANCH prod as se 阅读全文

posted @ 2024-07-20 08:00 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 185 下一页

导航