1 2 3 4 5 ··· 127 下一页

2025年3月11日

kiwipy rpc模式简单试用

摘要: 主要是对于功能的一个体验,测试几个功能 rpc模式代码 注意依赖了amqp协议,需要先部署服务 rabbitmq 服务 services: rabbitmq: image: rabbitmq:3-management ports: - "5672:5672" - "15672:15672" envi 阅读全文

posted @ 2025-03-11 08:00 荣锋亮 阅读(0) 评论(0) 推荐(0) 编辑

2025年3月10日

kiwipy 方便开发rpc&任务队列&广播的python消息库

摘要: kiwipy 方便开发rpc&任务队列&广播的python消息库,目前主要应用在aiidateam 项目中 包含的特性 每秒1000次的消息处理 高强健,不会在连接异常的时候丢失消息 原生支持rabbitmq 接口 支持任务队列,广播,rpc 支持线程以及协程模式的连接 支持python 3.7+ 阅读全文

posted @ 2025-03-10 08:00 荣锋亮 阅读(4) 评论(0) 推荐(0) 编辑

2025年3月9日

kombu transport 查找的处理

摘要: 简单说明下kombu transport查找的处理,方便学习自定义broker的处理 Connection 处理 def __init__(self, hostname='localhost', userid=None, password=None, virtual_host=None, port= 阅读全文

posted @ 2025-03-09 08:00 荣锋亮 阅读(1) 评论(0) 推荐(0) 编辑

2025年3月8日

celery broker 连接参数简单说明

摘要: 简单了解celery broker 连接参数的配置以及内部处理可以有助于更好的使用celery 以及开发自己的broker 支持 一个参考broker配置 redis redis://:password@hostname:port/db_number 自定义broker app = Celery( 阅读全文

posted @ 2025-03-08 08:00 荣锋亮 阅读(2) 评论(0) 推荐(0) 编辑

celery broker配置格式简单说明

摘要: celery 对于broker实际上是可以支持不少的,只是目前提供了一些简单说明 参考格式 redis redis://:password@hostname:port/db_number rabbitmq broker_url = 'amqp://myuser:mypassword@localhos 阅读全文

posted @ 2025-03-08 08:00 荣锋亮 阅读(3) 评论(0) 推荐(0) 编辑

2025年3月7日

honcho Foreman python 实现

摘要: honcho 使用 Foreman的 python实现,可以实现灵活的服务启动管理 参考使用 比如一个一个celery 启动的 创建Procfile文件 woker1: celery -A app worker -l INFO --queues queue1 woker2: celery -A ap 阅读全文

posted @ 2025-03-07 08:00 荣锋亮 阅读(7) 评论(0) 推荐(0) 编辑

2025年3月6日

slatedb 基于对象存储的嵌入式数据库

摘要: slatedb 是基于rust 开发的,数据存储层基于对象存储的嵌入式数据库 包含的特性 集成对象存储的持久性 零磁盘架构(利用对象存储) 简单复制(利用对象存储) 可调整的性能 读缓存 支持事物写(规划中,暂未实现) 快照隔离(规划中,暂未实现) 写隔离,可以阻止僵尸进程的影响 插件化的压缩处理 阅读全文

posted @ 2025-03-06 08:00 荣锋亮 阅读(7) 评论(0) 推荐(0) 编辑

2025年3月5日

kombu python 的消息库

摘要: kombu 是celery 团队开发的一个python 消息库,基于此库可以方便的进行amqt 语义api 的消息通信 包含的特性 支持插件化的消息通道机制,比如py-amqt, pyro,mongodb,redis 支持对于消息负载的自动编码,序列化,压缩 跨通道的一致异常处理 对于连接以及cha 阅读全文

posted @ 2025-03-05 08:00 荣锋亮 阅读(2) 评论(0) 推荐(0) 编辑

2025年3月4日

datachain 简单试用

摘要: 主要是一个体验,内容来自官方文档 参考代码 app.py from datachain import Column, DataChain meta = DataChain.from_json("gs://datachain-demo/dogs-and-cats/*json", object_name 阅读全文

posted @ 2025-03-04 08:00 荣锋亮 阅读(6) 评论(0) 推荐(0) 编辑

2025年3月3日

datachain ai 友好的python etl以及分析包

摘要: datachain 提供了方便进行多模态ai 数据的etl 以及分析能力 使用场景 多模态的数据准备以及数据治理 生成式ai 数据分析 特性 多模态数据集版本支持,支持数据以及元数据的统一持久化管理 python 友好,支持并行高效内存计算 数据增强以及处理,基于本地ai 模型或者llm api 生 阅读全文

posted @ 2025-03-03 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0) 编辑

2025年3月2日

celery signature app instance 创建简单说明

摘要: celery 对于celery 实例的处理比较有意思,没有的会创建默认的,如果定义了会基于python 的threading.local 进行引用,所以我们会看到 celery 一些代码使用上比较有意思(group,chain等,不需要明确指定app 就可以进行任务的创建以及数据获取) 一个简单通过 阅读全文

posted @ 2025-03-02 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

2025年3月1日

dramatiq python3的快速可靠的分布式任务处理库

摘要: dramatiq 是基于python3开发的分布式任务处理库 设计原则 高可靠性和高性能 简单易懂的核心 约定高于配置 与其他对比 官方提供了一个表还是值得参考的 说明 以上表很值得参考,后边会介绍下使用 参考资料 https://github.com/Bogdanp/dramatiq https: 阅读全文

posted @ 2025-03-01 08:00 荣锋亮 阅读(11) 评论(0) 推荐(0) 编辑

2025年2月28日

celery group job 不同queue的使用

摘要: celery group 的group 可以实现任务并行,实际上对于不同的task 我们还可以配置不同的queue,实现资源的灵活分配,当然对于queue 的worker 节点,我们可以部署在不同的环境中(比如cpu,gpu分离的场景中),这样实现资源的合理使用 task 定义 app.py fro 阅读全文

posted @ 2025-02-28 08:00 荣锋亮 阅读(7) 评论(0) 推荐(0) 编辑

2025年2月27日

perfetto开源系统profiling&应用trace 以及分析工具

摘要: perfetto 是google 开源的系统profiling 以及trace 工具 完整能力图 如下图,可以看到perfetto提供的维度还是比较全的,而且支持不同操作系统的trace能力 说明 基于官方提供的可视化ui 工具,可以快速体验perfetto包含的能力,对于性能分析此工具还是值得尝试 阅读全文

posted @ 2025-02-27 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0) 编辑

2025年2月26日

通过pyinstaller 打包bottle 应用

摘要: pyinstaller 是一个很不错的python 应用打包工具,灵活简单,以下对于以前一个简单的bottle 使用pyinstaller 打包 打包命令 代码参考下边的资料 参考命令 pyinstaller --add-data "static/*:static" app.py 一些细节 因为打包 阅读全文

posted @ 2025-02-26 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

2025年2月25日

bottle stream 模式数据返回简单示例

摘要: bottle对于支持迭代以及生成器的方法会使用类似stream 的模式返回数据,以下是一个简单的对于基于ollama 的stream 数据渲染处理示例 bottle 应用 app.py from bottle import route, run, template,static_file from 阅读全文

posted @ 2025-02-25 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

2025年2月24日

bottle python micro 框架

摘要: bottle是一个 python micro 框架,轻量简单 包含的特性 基于函数简单,动态路由 内置模版引擎,同时还支持jinja2,mako,cheetah 等模版引擎 内置灵活的工具类,的对于表单,文件,cookies,headers 处理 server 支持,支持适配兼容的wsgi 协议 说 阅读全文

posted @ 2025-02-24 08:00 荣锋亮 阅读(7) 评论(0) 推荐(0) 编辑

2025年2月23日

Eel 基于python+浏览器的开发类似electron 应用

摘要: Eel 是基于基于python 可以方便开发基于浏览器的桌面应用,内部eel 可以通过@eel.expose 实现js 与python 代码的互通信 包含的特点 使用简单 支持js 与python 代码的互相调用 支持回掉以及同步处理,当然还支持python 的异步处理 提供了基于pyinstall 阅读全文

posted @ 2025-02-23 08:00 荣锋亮 阅读(24) 评论(0) 推荐(0) 编辑

2025年2月22日

mindsdb dbt 扩展简单说明

摘要: mindsdb 提供了dbt 的adapter 利用了dbt 自定义物化的macro 实现一些资源的创建 目前提供的能力 支持integration predictor table 参考使用 一个简单示例 {{ config( materialized='integration', engine=' 阅读全文

posted @ 2025-02-22 08:00 荣锋亮 阅读(6) 评论(0) 推荐(0) 编辑

2025年2月21日

通过plpython 扩展解决pg 调用c library 的问题

摘要: 属于一个简单的业务问题,需要调用一个c 库,希望用sql 去处理,使用上就比较简单,不想自己遍历数据然后再调用c 库,因为系统使用的pg ,所以想着用pg 包装c 库为一个函数 解决方法 将c 库包装为一个独立的扩展,扩展集成了c 中的方法,然后就可以使用sql 处理了 通过plpython 扩展, 阅读全文

posted @ 2025-02-21 08:04 荣锋亮 阅读(4) 评论(0) 推荐(0) 编辑

mindsdb 的一些sql command

摘要: 主要是学习中的一个记录,发现mindsdb 中的一些 项目操作相关sql 创建项目&&查看&&移除 CREATE PROJECT [IF NOT EXISTS] project_name; SHOW DATABASES WHERE type = 'project'; DROP PROJECT [IF 阅读全文

posted @ 2025-02-21 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

2025年2月20日

mindsdb handlers 类型简单说明

摘要: mindsdb 按照设计,对于handler 分为了两大类(官方文档的介绍),data handlers 以及ml handlers,但是实际上从github 上的介绍来说还包含一个app handlers ,以下对于几种handler 作一个简单的说明 data handlers 作为数据库与mi 阅读全文

posted @ 2025-02-20 08:00 荣锋亮 阅读(5) 评论(0) 推荐(0) 编辑

2025年2月19日

mindsdb permanent_storage 简单说明

摘要: mindsdb 有一个permanent_storage 的配置,目前包含了三种模式,absent 不进行持久化,local 使用本地的,s3使用对象存储 配置参考 { "permanent_storage": { "location": "local" "bucket": "s3_bucket_n 阅读全文

posted @ 2025-02-19 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0) 编辑

2025年2月18日

omdd ollama 模型下载工具一些说明

摘要: omdd 对于使用上文档使用上部分不是特别清晰,以下简单说明下 下载元数据以及模型内容 通过omdd get 获取, 但是内容都是需要自己下载的,第一个是manifest,同时名称必须是这个 数据文件以及其他的是其余的,比如实际的blob 以及license等 manifest 以及下载的内容应该放 阅读全文

posted @ 2025-02-18 23:35 荣锋亮 阅读(64) 评论(0) 推荐(0) 编辑

omdd ollama 模型下载以及安装工具

摘要: 我以前简单介绍过关于ollama 模型的离线使用,实际上目前社区有一个不错的模型下载工具(ollama-model-direct-download),可以实现模型的离线化 ollama-model-direct-download 的特性 生成直接可以进行快速下载的地址 本地化安装可用的ollama模 阅读全文

posted @ 2025-02-18 19:08 荣锋亮 阅读(90) 评论(0) 推荐(0) 编辑

mindsdb 支持的一些环境变量

摘要: mindsdb 支持基于环境变量的一些参数配置,比如认证密码的,db连接的,当然也都是可以通过配置指定的 认证相关的 export MINDSDB_USERNAME='mindsdb_user' export MINDSDB_PASSWORD='mindsdb_password' 存储相关的 exp 阅读全文

posted @ 2025-02-18 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

2025年2月17日

mindsdb 对于预测结果的持久化的处理

摘要: 默认上mindsdb的预测处理是基于查询join的,但是很多时候我们希望直接使用,当然官方提供了几种方法 参考方法 基于视图 CREATE VIEW review_sentiment ( -- querying for predictions SELECT input.product_name, i 阅读全文

posted @ 2025-02-17 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

2025年2月16日

mindsdb 启动配置简单说明

摘要: mindsdb 启动命令包含了基于cli的默认配置,以及支持自定义配置的基于json文件的 默认启动配置 cli 参数 usage: __main__.py [-h] [--api API] [--config CONFIG] [--install-handlers INSTALL_HANDLERS 阅读全文

posted @ 2025-02-16 08:00 荣锋亮 阅读(11) 评论(0) 推荐(0) 编辑

2025年2月15日

mindsdb ai 数据平台

摘要: mindsdb 是基于python 开发的ai 数据平台,提供了基于sql的模型训练,微调,部署,版本控制等能力,应用的访问 上mindsdb 提供了rest api,mysq 协议,mongo协议,python 以及js sdk 等 包含的特性 接近200个集成包含了db 以及ai,ml 框架 支 阅读全文

posted @ 2025-02-15 08:00 荣锋亮 阅读(26) 评论(0) 推荐(0) 编辑

2025年2月14日

Daft UDF 简单说明

摘要: Daft 内部UDF 相比apply 提供了不少优化 apply 的使用 参考 df.with_column( "flattened_image", df["image"].apply(lambda img: img.flatten(), return_dtype=daft.DataType.pyt 阅读全文

posted @ 2025-02-14 08:00 荣锋亮 阅读(4) 评论(0) 推荐(0) 编辑

2025年2月13日

Daft delta lake dremio 集成一些问题

摘要: 一些问题 com.dremio.common.exceptions.UserException: Failed to read metadata for delta dataset /warehouse/myappdemo. Deltalake format version 3 is not sup 阅读全文

posted @ 2025-02-13 08:00 荣锋亮 阅读(8) 评论(0) 推荐(0) 编辑

2025年2月12日

Daft delta lake 集成简单试用

摘要: Daft 对于delta lake 支持本地写入以及基于catalog的,当前内部基于了delta-rs,对于catalog 的支持包含了aws glue 以及unity 以下是本地简单试用,对于基于unitycatalog的后边介绍下 简单试用 本地写入 import daft df = daft 阅读全文

posted @ 2025-02-12 08:00 荣锋亮 阅读(3) 评论(0) 推荐(0) 编辑

2025年2月11日

Daft nessie rest catalog + dremio 集成代码简单说明

摘要: 以前简单说明过集成玩法,以下通过代码示例简单说明下集成 nessie + dremio 部署 基于docker-compose 部署 docker-compose 一些参考可以参考我以前关于dremio 以及nessie 的一些介绍 version: "3" services: zk: image: 阅读全文

posted @ 2025-02-11 08:00 荣锋亮 阅读(6) 评论(0) 推荐(0) 编辑

2025年2月10日

Daft nessie rest catalog + dremio 集成

摘要: Daft 内部使用了pyiceberg 进行iceberg 的表操作,对于具体的catalog 都是pyiceberg 内部的能力,实际上我们可以直接集成nessie, 目前pyiceberg 对于rest catalog 支持的比较好,同时nessie 也支持rest catalog 了,以下是一 阅读全文

posted @ 2025-02-10 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

2025年2月9日

Daft 集成ray 测试

摘要: 通过集成ray 可以让Daft 实现分布式调度能力,以下是一个简单测试, ray 使用了本地模式 集成ray 测试 代码 是一个访问iceberg的示例代码 import daft import daft.context import ray ray.init() from pyiceberg.ca 阅读全文

posted @ 2025-02-09 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

2025年2月8日

pygetwindow 跨平台获取window 窗口包

摘要: pygetwindow 是一个跨平台的获取系统窗口的包,可以获取当前激活的窗口,以及或有打开窗口的标题 参考使用 安装 pip install pygetwindow 备注: 对于mac 系统需要安装pyobjc-framework-Quartz 这个包,方便集成Quartz 简单使用 注意mac 阅读全文

posted @ 2025-02-08 08:00 荣锋亮 阅读(41) 评论(0) 推荐(0) 编辑

2025年2月7日

Daft 集成iceberg 测试

摘要: Daft 就用pyiceberg 提供了对于iceberg 的集成,以下是一个简单测试 准备iceberg 表 直接基于了本地数据存储 参考代码 import daft from pyiceberg.catalog.sql import SqlCatalog as ISqlCatalog impor 阅读全文

posted @ 2025-02-07 08:00 荣锋亮 阅读(14) 评论(0) 推荐(0) 编辑

2025年2月6日

PyTables 基于hdf5 以及numpy 分层数据集包

摘要: PyTables 基于hdf5 以及numpy 分层数据集包,pandas 内部对于hdf5格式的处理就是基于了此包 包含的特性 支持表实体操作 多维以及表单元嵌入支持 表列支持索引操作 支持基于numpy 的数字数组 可扩展数组 可变长度数组 支持层级结构数据模型 用户定义元数据 支持读以及修改通 阅读全文

posted @ 2025-02-06 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

2025年2月5日

PyTables 提供的一些工具

摘要: PyTables 提供了一些工具,可以方便查看以及分析生成的文件,以下是一个简单说明 ptdump 提供了查看数据以及元数据信息 命令 usage: ptdump [-h] [-v] [-d] [-a] [-s] [-c] [-i] [-R RANGE] filename[:nodepath] Th 阅读全文

posted @ 2025-02-05 08:00 荣锋亮 阅读(14) 评论(0) 推荐(0) 编辑

2025年2月4日

hdf5 存储格式

摘要: hdf5是一种用于存储和管理大规模数据集的文件格式,广泛应用在数据科学中,pandas 等一些dataframe 框架提供了直接读写处理 包含的特点 层次化结构: HDF 文件可以组织成类似文件系统的层次结构,包含“组”和“数据集”。 组相当于文件夹,数据集相当于文件。 跨平台支持: HDF 文件在 阅读全文

posted @ 2025-02-04 08:00 荣锋亮 阅读(47) 评论(0) 推荐(0) 编辑

1 2 3 4 5 ··· 127 下一页

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示