长虫山小木屋

没有谁会为你踏雪而来 喜欢的风景要躬亲筚路

  博客园  :: 首页  :: 新随笔  :: 联系 ::  :: 管理
  115 随笔 :: 0 文章 :: 6 评论 :: 90332 阅读

读取写入千万级别的excel文件费时费力,调试起来比较慢,面对这个问题,第一步可以先无脑全部转换成pkl文件,这样几乎和内存操作一样的速度。

例如:

t=pd.read_excel("12月.xlsx",sheet_name=None)

excel全表读入,然后无脑写入硬盘:

import pickle
with open('test.pkl', 'wb') as f: pickle.dump(t,f)

用起来就直接取,操作速度几乎媲美内存操作吧

with open('test.pkl', 'rb') as f:
    t = pickle.load(f)

和pandas结合的操作是:

df.to_pickle(newfile)            #写
d = pd.read_pickle(thefile)      #读
posted on   长虫山小木屋  阅读(100)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示