Duckdb,很适合AI量化的一个基于本地文件系统的的olap分析引擎
关键优势在于数据控制的保留。当处理需要保持在组织内部或具有最高机密性的个人文件时,这个功能尤为重要,消除了通过第三方渠道传输信息的需求
duckdb可以轻松访问多个csv和parquet文件,作为本地的分析引擎很好用。
duckdb特别神奇的地方,可以对这多个文件夹下面的csv进行查询
###示例import duckdb
import pandas
DATA_DIR_CSVS= r"csvs/*/"
df = duckdb.query(
"""
select symbol,date,close from '{}/*.csv'
where date = '20230809'
""".format(DATA_DIR_CSVS)
)
print(df.df())
版本
duckdb D:\Tools\annot.duckdb
duckdb D:\Tools\duckdb\mytest.db
duckdb D:\Tools\duckdb_cli\data\mytest.db
duckdb.IOException: IO Error: Trying toread a database filewith version number 51, but we can only read version 43.
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库