PyTables 基于hdf5 以及numpy 分层数据集包
PyTables 基于hdf5 以及numpy 分层数据集包,pandas 内部对于hdf5格式的处理就是基于了此包
包含的特性
- 支持表实体操作
- 多维以及表单元嵌入支持
- 表列支持索引操作
- 支持基于numpy 的数字数组
- 可扩展数组
- 可变长度数组
- 支持层级结构数据模型
- 用户定义元数据
- 支持读以及修改通用的hdf5 格式文件
- 数据压缩,提供了不少数据压缩格式支持
- 高性能i/o操作
- 支持大于2G文件
- 架构无关(主要是基于了hdf5 点的特点)
说明
对于hdf5文件的操作基于PyTables 相比原生的h5py 会方便不少,同时也有利于与pandas以及duckdb 或者其他兼容dataframe的工具
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2024-02-06 dremio cloud cache 简单说明
2022-02-06 webjars 一般需要用到的几个插件
2022-02-06 frontend-maven-plugin webjars 模式构建web app
2022-02-06 reactive-interaction-gateway响应式交互网关
2022-02-06 grouparoo 源码项目结构
2021-02-06 idea 无法添加maven项目问题
2021-02-06 maven几个加速地址配置