Imagenet数据集制作流程
Imagenet数据集一般适用于分类任务。
1. 一级目录:包括Train、Test、classes.txt和test.txt四个文件。
2. 二级目录:Train和Test文件的下一级目录。根据类别分别建立文件,例如本实验有4个类别,就分别创建四个文件。将每个类别的数据放到对应类别的目录中。
3. classes.txt
分别有两列,第一列是分类的文件名,就是上二级目录文件名,第二列是对应类别。
4. test.txt
test文件就是存放测试集数据,第一列就是存放一级目录对应下来的文件相对路径。第二列就是对应的类别。
可以通过下程序自动写入
import os
# test文件夹对应路径
test_path = '/media/test'
test_txt = 'test.txt'
dirlist = os.listdir(test_path)
with open(test_txt, 'w') as f: # 如果filename不存在会自动创建, 'w'表示写数据,写之前会清空文件中的原有数据!
for i in os.listdir(test_path):
print(i)
for ii in os.listdir(os.path.join(test_path, i)):
print(i+'/'+ii+" "+i)
f.writelines(i+'/'+ii+" "+i+"\n")
f.close()
print("success")
至此,Imagenet数据集就制作完成了。