10 2024 档案

tldraw 创建基于web 白板的sdk 框架
摘要:tldraw 创建基于web 白板的sdk 框架 包含的特性 react canvas 高性能 实时协作 媒体支持 灵活的自定义 说明 tldraw 从3.0 开始调整累了许可模式,以前是商业使用需要有license,现在是可以直接使用了,但是会保留水印,对于开发白板应用的tldraw 是一个很值得 阅读全文

posted @ 2024-10-31 08:00 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

rill 基于duckdb 的快速bi 工具
摘要:rill 是基于duckdb 的快速bi 工具 参考架构 包含了提取,加载,查询,过滤,包含了etl,内存存储,以及操作型bi 说明 rill server 基于golang 开发,web 上使用了Sveltekit,rill 设计上很值得学习参考,抽象了不少自己的yaml schema 灵活性上很 阅读全文

posted @ 2024-10-30 08:00 荣锋亮 阅读(24) 评论(0) 推荐(0) 编辑

cloudpathlib 简单试用
摘要:通过minio 作为s3 存储进行测试 s3 准备 docker-compose version: "3" services: s3: image: minio/minio:latest ports: - 9000:9000 - 9001:9001 command: server /data --c 阅读全文

posted @ 2024-10-29 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0) 编辑

cloudpathlib 面向云存储的python pathlib 风格的数据处理
摘要:cloudpathlib 是模仿了python pathlib 接口格式的python 库,可以用来方便的进行云存储的数据处理 包含的特性 与path 方式类似的访问 支持s3,gcs,azure ,ftp 也在开发中 可扩展 读写支持 无缝的cache 支持,可以按需进行cache 的处理 方便测 阅读全文

posted @ 2024-10-28 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0) 编辑

stamina 生产级的python 重试包
摘要:stamina 是基于tenacity的包装 包含的特性 仅对某些异常(甚至是其中的子集)进行重试,方法是先使用谓词进行自检 重试之间带有抖动的指数退避 限制重试次数和总时间 自动异步支持-包括Trio 保留所装饰的可调用函数的类型提示 开箱即用,可灵活使用Prometheus、structlog和 阅读全文

posted @ 2024-10-27 08:00 荣锋亮 阅读(6) 评论(0) 推荐(0) 编辑

dremio 25.2 软件包以及github 源码更新了
摘要:昨天我说了dremio 发布了25.2 提供了新的catalog 支持,之后过了一段时间dremio同时也提供了软件包以及github 源码的更新 说明 25.1 版本构建关于dremio-js 的 私服问题在这次代码中也看到解决了,新功能代码可以看看 参考资料 https://github.com 阅读全文

posted @ 2024-10-26 08:13 荣锋亮 阅读(28) 评论(0) 推荐(0) 编辑

python通过__init__.py 进行模块依赖包的check
摘要:很多时候我们开发模块化项目,或者动态加载功能包的项目,对于依赖我们不希望直接在安装的时候就安装,而是按需使用 的时候进行主动安装(比如langchain 不少模块),解决方法很多,以下说明下基于__init__.py 的处理 一些参考解决方法 在调用模块方法的时候通过显示的import 模块,并通过 阅读全文

posted @ 2024-10-26 00:22 荣锋亮 阅读(14) 评论(0) 推荐(0) 编辑

dremio 25.2 发布
摘要:就在昨天dremio 发布了25.2 版本,此版本对于catalog 的支持添加了两个新的(Polaris Catalog 以及Unity Catalog) 说明 其他主要是关于历史bug 的fix 对于新catalog ce 版本实际上只Polaris Catalog ,默认没开启,需要通过plu 阅读全文

posted @ 2024-10-25 23:47 荣锋亮 阅读(20) 评论(0) 推荐(0) 编辑

weasyprint 基于html 的pdf 生成框架
摘要:weasyprint 基于html 的pdf 生成框架,我们可以基于css+ html 生成高质量的pdf 文件,weasyprint 使用简单 说明 weasyprint 的速度并不是很快,如果希望快速生成pdf文件的,可以选择其他解决方案,md2pdf 就使用了WeasyPrint只是为了支持灵 阅读全文

posted @ 2024-10-25 08:00 荣锋亮 阅读(36) 评论(0) 推荐(0) 编辑

通过rye 进行maturin rust python 扩展开发
摘要:rye 实际上也是一个python 包管理工具,实际上与uv 是比较类似的工具,都是同一个团队开发的,但是uv 相对晚一些出现的 rye 可以进行maturin 项目的开发,maturin 实际上也提供了内置的cli 可以快速开发 maturin 项目初始化 命令 rye init my-proje 阅读全文

posted @ 2024-10-24 08:00 荣锋亮 阅读(15) 评论(0) 推荐(0) 编辑

uv python 版本管理
摘要:最近版本的uv 也支持对于python 版本的管理(下载安装,支持cpython 以及pypy) 安装python 参考命令 uv python install 3.12.3 查看列表 uv python list 查找python 执行程序 uv python find # 默认是基于path的, 阅读全文

posted @ 2024-10-23 08:00 荣锋亮 阅读(166) 评论(0) 推荐(0) 编辑

基于uv 进行类似cargo 的workspace 管理
摘要:uv 支持类似cargo workspace模式的项目管理,可以实现多模块的开发机制,以下是一个简单学习 准备 uv 对于workspac 的支持,使用上类似rust cargo 项目结构 ├── README.md ├── packages │ ├── api │ │ ├── README.md 阅读全文

posted @ 2024-10-22 08:00 荣锋亮 阅读(30) 评论(0) 推荐(0) 编辑

uv 基于rust 编写的python 包管理以及项目管理工具
摘要:uv 基于rust 编写的python 包管理以及项目管理工具 包含的特性 简单工具可以替换pip,pip-tools,pipx,poetry,pyenv 等 比pip 快10-100 倍 安装以及管理python 版本 运行以及安装python 应用 运行脚本 支持类似cargo 模式的works 阅读全文

posted @ 2024-10-21 08:00 荣锋亮 阅读(42) 评论(0) 推荐(0) 编辑

基于prompt-poet进行了灵活的提示词模版管理
摘要:以前简单介绍过prompt-poet的使用,同时也进行了一些扩展(比如支持s3,oss,等加载的loader 集成) 实际上使用好prompt-poet 可以简化不少我们的提示词管理能力,实现灵活的个性化提示词能力,以下是一个简单的 使用说明 参考结构管理 prompt-poet 默认支持加载本地文 阅读全文

posted @ 2024-10-20 08:00 荣锋亮 阅读(25) 评论(0) 推荐(0) 编辑

pyfilesystem 一个简单试用
摘要:以前简单介绍过关于pyfilesystem 支持通用的文件系统访问,同时还提供了不少内部实现,可以快速使用,以下是一个关于 UserDataFS的简单试用 参考代码 app.py from fs.appfs import UserDataFS user_fs = UserDataFS('my_app 阅读全文

posted @ 2024-10-19 08:00 荣锋亮 阅读(6) 评论(0) 推荐(0) 编辑

pyfilesystem jinja2 loader 实现prompt-poet 提示词模板管理
摘要:效果实际与fsspec jinaj2 laoder类似,就是一个集成测试 pyfilesystem loader 实现 pyfs_loader.py import fs import jinja2 from jinja2.loaders import BaseLoader class PyFiles 阅读全文

posted @ 2024-10-18 06:29 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

pyfilesystem python 通用文件系统抽象
摘要:pyfilesystem python 通用文件系统抽象包,对于统一基于文件的数据操作比较方便 目前一些内置的文件系统 app 文件系统 ftp 文件系统 memory 文件 mount 文件系统 multi 文件系统 os 文件系统 sub 文件系统 tar 文件系统 temporary 文件系统 阅读全文

posted @ 2024-10-17 06:12 荣锋亮 阅读(12) 评论(0) 推荐(0) 编辑

md2pdf python markdown 转pdf 包简单试用
摘要:md2pdf 是基于weasyprint 开发的一个markdown 转pdf 工具,功能上还是比较强大的,支持自定义效果,同时还支持基于jinja2 模版引擎的数据处理,在基本的转换完成之后内部会使用weasyprint 基于html 转换pdf 参考使用 安装 pip install git+h 阅读全文

posted @ 2024-10-16 05:56 荣锋亮 阅读(90) 评论(0) 推荐(0) 编辑

fsspec jinaj2 loader 简单说明
摘要:为了方便使用,我简单提取了jinja2 fspsec loader 的代码,开发成为一个pip 包,方便使用 代码 fsspec_loader.py from __future__ import annotations import pathlib from typing import TYPE_C 阅读全文

posted @ 2024-10-15 06:57 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

自定义jinja2 loader 实现基于oss的prompt-poet 提示词模板存储
摘要:prompt-poet 默认支持的是基于本地文件系统或者直接模版内容的模式进行处理,对于实际使用上并不是很方便,可以通过简单的扩展jinja2 loader 实现基于fsspec 的模版加载,这么就可以支持各类存储的模型了,以下是一个简单示例,因为目前prompt-poet 内部处理是固定的,暂时只 阅读全文

posted @ 2024-10-14 06:40 荣锋亮 阅读(19) 评论(0) 推荐(0) 编辑

chainlit 实际部署一些问题
摘要:chainlit内部基于了socket.io 进行消息处理,socket.io 是有一些缺陷的,但是也有相关的解决方法,同时 对于启动的入口是加载的一个python 文件,这个处理上是动态加载里边的方法到chainlit 运行环境的 内部一些处理 load 模块处理 def load_module( 阅读全文

posted @ 2024-10-13 07:43 荣锋亮 阅读(53) 评论(0) 推荐(0) 编辑

fasthtml 快速创建web app 的框架
摘要:fasthtml 让我们可以基于python 代码就可以快速开发web app 的框架,使用上简单 说明 fasthtml 包含了丰富的组件,内部web 框架基于了starlette 与fastapi 是一样的,fasthtml 值得尝试下 参考资料 https://github.com/Answe 阅读全文

posted @ 2024-10-12 06:08 荣锋亮 阅读(101) 评论(0) 推荐(0) 编辑

chainlit 一些外部集成部署方法
摘要:chainlit 对于部署支持多种模式,比如直接all-in-one 的,基于fastapi 集成的(api 模式),基于copilot (web 地址 ),react (web 组件),以及其他外部集成,比如slack,team,discord 等,以下简单说明下 模式说明 web app 模式 阅读全文

posted @ 2024-10-11 07:20 荣锋亮 阅读(58) 评论(0) 推荐(0) 编辑

fastapi 通过依赖注入模式使用apscheduler
摘要:就是一个简单记录,方便后续使用 参考代码 api 服务 import uuid from fastapi import FastAPI,Header,Depends,HTTPException from typing import Annotated async def tenant_id(x_te 阅读全文

posted @ 2024-10-10 06:42 荣锋亮 阅读(39) 评论(0) 推荐(0) 编辑

fastapi apscheduler 通过函数引用添加job
摘要:主要是一个简单测试,同时集成fastapi,包含了简单参数传递 参考代码 import logging import uuid from fastapi import FastAPI from pytz import utc from apscheduler.schedulers.backgroun 阅读全文

posted @ 2024-10-09 06:35 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

python 几个IOC 框架
摘要:整理几个不错的python ioc 框架,方便学习使用 python-dependency-injector 功能很全,很强大,支持的特性比较多,属于比较全面的ioc 框架了 lagom 一个轻量的ioc 框架,常见玩法够用 FastDepends 这个实际上是来自fastapi 提取的一个ioc 阅读全文

posted @ 2024-10-08 06:47 荣锋亮 阅读(59) 评论(0) 推荐(0) 编辑

关于结合faststream + python rq callback 进行job 状态标记的简单说明
摘要:以前简单介绍过基于faststream + python rq callback 进行job 状态标记,以下是结合源码说明下处理 参考玩法 代码实现 faststream 参考代码 from faststream.redis import RedisBroker from faststream.as 阅读全文

posted @ 2024-10-07 06:41 荣锋亮 阅读(13) 评论(0) 推荐(0) 编辑

python rq 实际部署使用简单说明
摘要:python 的rq 是一个简单,使用方便的分布式任务队列库,以下是自己关于实际使用一些总结 参考玩法 参考图 简单玩法流程: app 业务层使用rq 库,链接redis,然后将任务如队列,同时可以结合实际业务对于队列使用不同的名称(比如高中低,或者特定业务模型) 对于实际结合业务特点在不同的业务节 阅读全文

posted @ 2024-10-06 00:02 荣锋亮 阅读(42) 评论(0) 推荐(0) 编辑

kedro ossfs 支持说明
摘要:kedro 是基于fsspec 进行内部文件处理的,但是在对于是cloud remote 文件系统的时候是基于白名单处理的有缺陷,对于oss 支持就有问题(比如解析bucket),解决方法很多,一种是直接修改kedro.io.core 中的CLOUD_PROTOCOLS,还有一种就是通过python 阅读全文

posted @ 2024-10-05 06:27 荣锋亮 阅读(4) 评论(0) 推荐(0) 编辑

dremio 25.1 版本开始支持sql 预编译处理了
摘要:dremio 从25.1 版本开始,支持sql 预编译了,可以更好的提升系统的安全性 参考使用 传统jdbc 模式 Connection conn = DriverManager.getConnection("jdbc:dremio:direct=localhost:31010;schema=sys 阅读全文

posted @ 2024-10-04 14:24 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

lazy_loader attach_stub一种变体玩法
摘要:此方法在scikit-image包中可以明显看到使用 玩法流程 __init__.py直接基于attach_stub 进行定义懒加载,以后的使用就同时标准玩法了 添加__init__.pyi 进行显示的引入定义,方便实现类型检查以及ide 的自动提示 一个参考玩法 __init__.py 定义 im 阅读全文

posted @ 2024-10-04 08:00 荣锋亮 阅读(3) 评论(0) 推荐(0) 编辑

dremio25.1.1 发布
摘要:就在昨天dremio 发布了25.1.1 主要是一些bug 的fix,尤其是在25.1 版本对于script 保存的问题 说明 完整的变动信息可以参考官方文档,目前oss 代码以及下载包,docker 镜像已经都上传了,可以体验下 参考资料 https://docs.dremio.com/curre 阅读全文

posted @ 2024-10-03 12:56 荣锋亮 阅读(10) 评论(0) 推荐(0) 编辑

lazy_loader python 子包以及函数懒加载框架
摘要:lazy_loader python 子包以及函数懒加载框架, 内部处理上是基于了importlib.import_module 进行动态加载 包含的特性 可以确保子模块对于用户的可见行,不引起而外的开销 允许外部库在使用的时候被加载,提升导入时间 说明 此包在kedro 的datasets 模块中 阅读全文

posted @ 2024-10-03 08:00 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

dynaconf python 配置管理库
摘要:dynaconf python 配置管理库 包含的特性 基于12 factor 原则 设置管理(默认值、校验、解析、模版) 保护敏感信息(比如用户密码) 多文件格式支持(toml,yaml, ini,json,py) 支持环境变量重写 可选的分层多环境配置支持 支持外部配置存储(vault,redi 阅读全文

posted @ 2024-10-02 07:24 荣锋亮 阅读(20) 评论(0) 推荐(0) 编辑

kedro IncrementalDataset 简单说明
摘要:IncrementalDataset 实现了一种增量数据处理的能力,基于了PartitionedDataset 同时包含了checkpoint 确保数据处理的准确性,对于 checkpoint 可以配置自己的函数 参考定义 参考catalog 定义 my_partitioned_dataset: t 阅读全文

posted @ 2024-10-01 08:00 荣锋亮 阅读(3) 评论(0) 推荐(0) 编辑

导航