2025年10月14日

pypdfium2 PDFium 的python 包装

摘要: pypdfium2 是对于PDFium的python 包装,官方说明处理任务性能可以接近PyMuPDF 说明 pypdfium2 内部基于了ctypesgen 包装(相比原始进行了自己的扩展),生成python 绑定的代码,这样可以进行快速的代码处理,我在测试提取一个14m的pdf 文本内容花了不到 阅读全文

posted @ 2025-10-14 08:00 荣锋亮 阅读(5) 评论(0) 推荐(0)

2025年10月13日

rqlite java sdk 对于sqlite-vec 支持的bug

摘要: sqlite-vec 查询返回的distance 是real 类型的,但是rqlite java sdk 对于类型了check,如果没在代码里边的会直接提示异常 解决方法 实际上real 与包含精度的float 类型是类似的,解决方法就比较简单了,配置兼容就可以了 参考示例代码 具体需改的地方比较多 阅读全文

posted @ 2025-10-13 08:00 荣锋亮 阅读(7) 评论(0) 推荐(0)

2025年10月12日

通过rqlite sdk 快速访问sqlite-vec

摘要: sqlite-vec 的的轻量化以及标准sqlite 扩展的模式对于需要使用向量存储的场景(比如相似比较的),但是使用上可能并不是很友好(从轻量化来说够用了,但是我们很多时候还是需要server 以及轻量能力,同时将扩展隐藏起来,方便维护),rqlite 是一个不错的基于sqlite 但是支持分布式 阅读全文

posted @ 2025-10-12 08:00 荣锋亮 阅读(5) 评论(0) 推荐(0)

2025年10月11日

marimo python 响应式notebook 框架

摘要: marimo python 响应式notebook 框架 包含的特性 功能齐全,可以用来替换jupter,streamlit,papermill 等 响应式 git 友好,存储为.py文件 面向数据的设计 ai native 可共享,可以部署为可交互的界面 可执行(因为是py文件,可以直接执行) 可 阅读全文

posted @ 2025-10-11 09:56 荣锋亮 阅读(10) 评论(0) 推荐(0)

2025年10月10日

dremio sql server uniqueidentifier 数据类型问题

摘要: uniqueidentifier 类型用来存储guid,sql server内部存储为16个固定字节的二进制数据,在dremio 当前的arp 类型映射中,存储为了varbinary,机制上没有问题,但是很多时候大家希望使用可视化的字符串格式uuid(因为映射为varbinary,界面显示就是一个b 阅读全文

posted @ 2025-10-10 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0)

2025年10月9日

使用sqlite-loadable-rs开发一个简单sqlite uuid 扩展

摘要: 默认sqlite 缺少uuid 函数, sqlite-loadable-rs 是一个基于rust包装的框架,可以用来快速开发sqlite 扩展,以下是一个简单测试 项目准备 cargo.toml 注意当前edition = "2021" ,2024 因为一些macro的问题,编译会有问题,对于uui 阅读全文

posted @ 2025-10-09 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0)

2025年10月8日

sqlite-loadable-rs rust 开发sqlite 扩展

摘要: sqlite-loadable-rs 是一个受rusqlite,以及pgx 启发的框架,可以使用rust 开开发sqlite 扩展 包含的特性 支持标量函数 支持表函数 支持虚拟表 说明 sqlite 一些扩展就是基于sqlite-loadable-rs开发的(sqlite-xsv,base64 等 阅读全文

posted @ 2025-10-08 07:49 荣锋亮 阅读(5) 评论(0) 推荐(0)

2025年10月7日

通过litestream 进行sqlite-vec 数据备份以及恢复

摘要: 实际上就是一个简单的测试,litestream 支持流式复制,比较适合对于sqlite进行备份,同时litestream 还支持对象存储的remote 模式,比较方便 环境准备 minio services: s3: image: minio/minio command: server /data 阅读全文

posted @ 2025-10-07 08:00 荣锋亮 阅读(11) 评论(0) 推荐(0)

2025年10月6日

plexe 通过提示词构建机器学习模型

摘要: plexe是一个可以通过提示词构建机器模型的框架 内部如何处理的 计划,分析用户意图以及数据,开发模型构建测试 代码生成,通过比较知名的库(tensorflow,pytorch,scikit-learn) 创建合适机器学习代码 执行以及提炼,运行生成的代码,评估结果,迭代提示性能 部署,打包模型,方 阅读全文

posted @ 2025-10-06 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0)

2025年10月5日

fasthx fastapi服务器端渲染看框架

摘要: fasthx 是一个fastapi 的服务器端渲染框架 包含的特性 基于装饰器的语法 内置htmx 支持任何模版引擎,htmy,jinja2,dominate 对于装饰器路路由渲染引擎支持访问所有依赖 支持异步以及同步路由 支持类型提示 支持响应头透传 说明 fasthx 支持htmx模版引擎的套路 阅读全文

posted @ 2025-10-05 11:22 荣锋亮 阅读(9) 评论(0) 推荐(0)

2025年10月4日

rqlite 集成sqlite-vec 简单说明

摘要: rqlite 是一个基于raft 的实现的分布式sqlite,sqlite-vec 是可以直接集成rqlite的,核心是sqlite 的插件机制,以下是一个简单试用 环境准备 可以使用docker 或者直接下载二进制包运行,为了方便,我直接使用mac 的rqlite 包 安装 brew instal 阅读全文

posted @ 2025-10-04 08:05 荣锋亮 阅读(14) 评论(0) 推荐(0)

2025年10月3日

orbital 转换scikitlearn pipeline 为sql的框架

摘要: orbital 是一个转换scikitlearn pipeline 为sql的框架,设计上比较有意思,可以将我们训练好的scikitlearn 模型,直接转换为sql 执行,这样进行实际推理预测就会特别简单了,内部实际核心是将训练的权重数据提取出来,转换为实际执行的sql 参数 参考示例 # Cre 阅读全文

posted @ 2025-10-03 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0)

2025年10月2日

openinference 基于OpenTelemetry的ai 应用可观测性指南

摘要: openinference 基于OpenTelemetry提供了ai 应用可观测性指南,同时包含了不少ai 框架的实现,包含ai sdk,ai agent,mcp 等 说明 ai 应用的可观测性还是很重要的,实际上也有不少其他开源实现,基于OpenTelemetry的好处是可以复用一套标准的指南,实 阅读全文

posted @ 2025-10-02 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0)

2025年10月1日

sqlite-vec 简单试用

摘要: sqlite-vec 官方实际有一些文档,同时github 也有不少示例,以下就是一个简单使用(集成python) 创建虚拟表 参考命令 import sqlite3 import sqlite_vec from sqlite_vec import serialize_float32 import 阅读全文

posted @ 2025-10-01 08:14 荣锋亮 阅读(13) 评论(0) 推荐(0)

2025年9月30日

sqlite-vec sqlite vector 扩展

摘要: sqlite-vec 是一个很不错的sqlite vector支持扩展,支持不少语言,同时基于sqlite 的虚拟表,实现了比较灵活的处理 一些特性 虚拟表,支持分片,元数据,以及辅助字段(有些进行分片,有些进行查询),当然目前对于分片以及元数据支持的类型有限定 比较轻量,支持wasm等 说明 以前 阅读全文

posted @ 2025-09-30 08:00 荣锋亮 阅读(14) 评论(0) 推荐(0)

2025年9月29日

手工调整pip whl 文件内容

摘要: 属于一个比较常见的问题,比如我们希望自己修改一个whl 文件的内容,但是还是通过pip install 的模式,不希望通过pip 安装之后再手工进行文件替换,解决方法比较简单 有源码的 可以自己重新构建 没有源码的 可以直接进行whl 替换,因为whl 实际就是zip文件,我们可以先解压,然后替换, 阅读全文

posted @ 2025-09-29 08:00 荣锋亮 阅读(13) 评论(0) 推荐(0)

2025年9月28日

mcp playwright 简单试用

摘要: 主要是一个演示集成,可以体验到mcp+ 大模型的方便之处 参考玩法 简单说明: 用户可以通过mcp client 或者集成的agent,然后client 配置playwright mcp 服务,对于 playwright mcp 服务可以使用remote cdp server 这样可以减少本地的资源 阅读全文

posted @ 2025-09-28 08:00 荣锋亮 阅读(36) 评论(0) 推荐(0)

2025年9月27日

dremio 26.0.5 社区版源码以及包提供下载了

摘要: 就在昨天dremio 26.0.5 社区版源码以及包都提供了下载地 说明 实际上应该是很早就提供了,就是昨天才发布的,有空了可以研究下新的功能 参考资料 https://download.dremio.com/community-server/ https://docs.dremio.com/cur 阅读全文

posted @ 2025-09-27 19:15 荣锋亮 阅读(13) 评论(0) 推荐(0)

通过mcp-use client 调用mcp 服务方法

摘要: mcp-use 提供了client,可以方便与mcp server 进行通信,是一个不错的方便测试的工具 参考代码 app.py import asyncio from mcp_use import MCPClient async def main(): config = { "mcpServers 阅读全文

posted @ 2025-09-27 10:01 荣锋亮 阅读(21) 评论(0) 推荐(0)

2025年9月26日

mcp-use mcp server 交互工具

摘要: mcp-use mcp server 交互工具,当然mcp-use 不支持简单的mcp client,还支持agent开发,通过mcp-use 我们可以将llm 与mcp server 集成起来,提升agent 的能力 简单示例 import asyncio import os from doten 阅读全文

posted @ 2025-09-26 08:00 荣锋亮 阅读(21) 评论(0) 推荐(0)

2025年9月25日

dremio 26.0.5社区版发布

摘要: 实际上26.0.5版本已经很早就发布了,没太注意,这次实际上官方只是提供了docker 镜像,对于下载地址的暂时没提供,同时ce 源码暂时也没问题,具体解决了那些问题,只能结合release note 看(但是当前只有企业版信息的) 说明 目前实际上有好几个26.0的问题,等有空了测试下26.0.5 阅读全文

posted @ 2025-09-25 07:10 荣锋亮 阅读(19) 评论(0) 推荐(0)

2025年9月24日

macos ld: unsupported tapi file type '!tapi-tbd' in YAML file 问题解决

摘要: 实际此问题属于一个比较常见的问题,解决方法实际上都是一样的,就是升级llvm,gcc 等,但是我系统使用了相关解决方法依然没解决,后边发现是因为anaconda3 因为的(path 变量) 解决方法 很简单,已经确定是anaconda3 path 造成系统的ld 没生效,那就让anaconda3 的 阅读全文

posted @ 2025-09-24 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0)

2025年9月23日

litserve openapi schema 处理简单说明

摘要: litserve 在处理openai schema 的时候实际上还是利用了fastapi 的能力,只是litserve 抽象了api 开发的处理,对于openapi request 以及response 的类型基于了动态获取(通过python 的inspect 模块) 参考处理 server.py 阅读全文

posted @ 2025-09-23 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0)

2025年9月22日

enrichmcp 构建数据驱动mcp的框架

摘要: enrichmcp 构建数据驱动mcp的框架 包含的特性 通过数据模型生成类型工具 处理实体关系 处理schema 发现 通过pydantic 模型进行input 以及output 校验 支持database,api,自定义逻辑 支持上下文以及认证 应用场景 语义层,ai agent 理解数据的含义 阅读全文

posted @ 2025-09-22 08:05 荣锋亮 阅读(15) 评论(0) 推荐(0)

2025年9月21日

mcp-server-chart chart mcp 服务

摘要: 基于antv 的mcp 服务,支持25+ charts 的生成,对于图表的开发还是挺方便的,对于图表的渲染基于了ssr,同时官方还提供了额一个示例实现(ssr 转换为图片) 简单试用 安装 npm install -g @antv/mcp-server-chart 启动 mcp-server-cha 阅读全文

posted @ 2025-09-21 08:00 荣锋亮 阅读(53) 评论(0) 推荐(0)

2025年9月20日

wxt 开发浏览器插件的框架

摘要: wxt 开发浏览器插件的框架 支持的特性 支持所有浏览器 支持mv2 以及mv3 协议 开发模式支持热更新 基于文件的entrypoints 基于ts 开发 支持自动导入 自动发布 支持vue,react,svelte 等框架 说明 如果看过chrome mcp 扩展,会发现词工具也使用了wxt 框 阅读全文

posted @ 2025-09-20 08:07 荣锋亮 阅读(32) 评论(0) 推荐(0)

2025年9月19日

agentgateway 简单试用

摘要: 以下是一个简单示例,主要测试多mcp tools 的聚合,集成了基于litserve 的mcp server 以及genai toolbox 安装 目前github 上暂时未系统mac x86 架构的包,可以自己编译 命令 git clone https://github.com/agentgate 阅读全文

posted @ 2025-09-19 08:00 荣锋亮 阅读(11) 评论(0) 推荐(0)

2025年9月18日

cocoindex 面向ai 的数据转换框架

摘要: cocoindex 面向ai 的数据转换框架基于rust开发,提供了python sdk,提供了基于data flow 的数据开发模式,支持增量数据更新 支持embedding 方便构建知识库,同时提供了超越sql 的数据处理能力 内置的一些操作 source 支持本地文件,s3,googledri 阅读全文

posted @ 2025-09-18 08:00 荣锋亮 阅读(17) 评论(0) 推荐(0)

2025年9月17日

mcp-framework 基于typescript开发mcp 服务的框架

摘要: mcp-framework 基于typescript开发mcp 服务的框架 包含的特性 tool 支持 进行资源管理,包含data source 以及api 支持定义可重用的提示词模版 多协议通道支持(stdio,sse,http stream) 认证,jwt 以及api key 模式 typesc 阅读全文

posted @ 2025-09-17 08:00 荣锋亮 阅读(29) 评论(0) 推荐(0)

2025年9月16日

dremio 自定义静态资源的处理

摘要: 有些时候我们希望自定义一些dremio的页面,默认dremio 对于静态资源有一些约定 参考定义 DremioServer fallbackServletHolder if (config.serveUI) { final String basePath = "rest/dremio_static/ 阅读全文

posted @ 2025-09-16 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0)

2025年9月15日

litserve使用zeromq 处理

摘要: litserve包含了基于多进程以及基于mq 的transport处理,默认基于多进程,同时LitServer 有一个参数可以配置基于mq的 参考配置 LitServer 支持的配置 class LitServer: """Initialize a LitServer for high-perfor 阅读全文

posted @ 2025-09-15 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0)

2025年9月14日

litserve LitSpec 简单说明

摘要: litserve LitSpec 是一个比较有意思,同时强大的功能,可以实现快速ai 服务开发,对于openai 的支持就是利用了此 当前参考实现 如下图,包含了openai 以及embedding 内部处理机制 实际上核心还是以前的LitAPI,支持如果对于api 配置了spec将会使用spec 阅读全文

posted @ 2025-09-14 08:09 荣锋亮 阅读(11) 评论(0) 推荐(0)

2025年9月13日

litserve 同时集成OpenAISpec以及OpenAIEmbeddingSpec

摘要: litserve 的spec 是一个比较强大的能力,可以快速进行openai 兼容api的处理,这样我们就可以提供自己的openai 兼容api 了 参考使用 demo.py import litserve as ls from litserve.mcp import MCP from pydant 阅读全文

posted @ 2025-09-13 08:17 荣锋亮 阅读(9) 评论(0) 推荐(0)

2025年9月12日

just 类似make 的命令行runner

摘要: just 类似makefile 的命令行runner,但是相比makefile 简洁清晰了不少,同时也类似make的makefile 提供了一个justfile 方便编写各类命令 一个参考示例 dev: just fetch just fmt just codegen just lint just 阅读全文

posted @ 2025-09-12 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0)

2025年9月11日

Nugine- s3s s3 服务适配器

摘要: Nugine- s3s 是基于hyper服务实现的s3 兼容层 工作机制 如下图 说明 对于s3 api 序列化以及类型上使用了aws rust s3 sdk 通过smithy 生成的代码,原则上兼容性比较好,目前rustfs (rust s3 开源服务实现就使用了此包) 参考资料 https:// 阅读全文

posted @ 2025-09-11 09:17 荣锋亮 阅读(8) 评论(0) 推荐(0)

2025年9月10日

通过litserve的多endpoint 提供mcp 服务

摘要: litserve 支持多endpoint 以及mcp了,这样我们就可以方便的基于多endpoint 提供mcp服务了,以下是一个简单试用 服务定义 安装依赖 注意当前litserve 依赖mcp python sdk,但是对于新版本支持有问题(mcp 接口调整,我发了一个pr 已经合并了,但是还没发 阅读全文

posted @ 2025-09-10 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0)

2025年9月9日

chainlit 支持做为mcp client 了

摘要: chainlit 从2.4.0 来时支持集成mcp server 了,机制上实际就是获取mcp 提供的tools,然后使用chainlit 的tools 调用 说明 目前chainlit 主要支持了stdio 以及sse 对于streamable-http 暂时不支持,后边介绍的详细使用 参考资料 阅读全文

posted @ 2025-09-09 08:00 荣锋亮 阅读(20) 评论(0) 推荐(0)

2025年9月8日

flume rust 多生产者以及多消费者的crate包

摘要: flume是一个rust 包,实现了多生产者以及多消费者的功能,是一个比较知名的rust 包 包含的特性 支持无缓冲、带缓存、约定队列 高性能 安全 灵活,只是多线程共享,可以用来灵活的构建复杂系统通信 使用简单 支持异步,同时也可以与同步代码混用 支持类似select 模式的使用(golang 使 阅读全文

posted @ 2025-09-08 08:00 荣锋亮 阅读(11) 评论(0) 推荐(0)

2025年9月7日

setuptools-rust 方便基于rust 构建python 扩展的工具

摘要: setuptools-rust 是一个setuptools扩展,可以用来方便的构建基于rust 的python 扩展,是pyo3 团队开发的,当然maturin 这个cli 也是一个比较方便的工具,使用更加方便 说明 对于使用setuptools 构建工具的,setuptools-rust 是一个不 阅读全文

posted @ 2025-09-07 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0)

2025年9月6日

dbt-fusion 下一代dbt engine

摘要: dbt-fusion 是基于rust 开发的下一代dbt engine,性能上会比以前基于python的快不少,同时应该可以更好的和数据分析周边的工具集成 技术上apache arrow,datafusion,adbc 等技术是核心 说明 目前二进制构建包已经提供了大家可以体验下,当然从官方的介绍来 阅读全文

posted @ 2025-09-06 11:54 荣锋亮 阅读(20) 评论(0) 推荐(0)

导航