训练技巧之数据集太多，加载太慢怎么办？

1. 背景

训练集全是16x16，32x32之类的小图，达到上千万张，训练时发现数据加载很慢很慢很慢！！！看了下CPU 内存 GPU使用情况，发现CPU使用率都跑到90%去了，GPU使用率却较低

对于大规模的小文件读取，建议转成单独的文件，可以选择的格式可以考虑：TFRecord（Tensorflow）、recordIO（recordIO）、hdf5、 pth、n5、lmdb 等等

预读取下一次迭代需要的数据，参考给pytorch 读取数据加速

直接载到内存里面，或者把把内存映射成磁盘好了，参考如何给你PyTorch里的Dataloader打鸡血

把读取速度慢的机械硬盘换成 NVME 固态吧～

posted @ 2020-10-26 22:48 程序员-图哥阅读(1697) 评论(0) 编辑收藏举报

刷新页面返回顶部