Imagenet数据集制作流程

Imagenet数据集一般适用于分类任务。

1. 一级目录:包括Train、Test、classes.txt和test.txt四个文件。

 

2. 二级目录:Train和Test文件的下一级目录。根据类别分别建立文件,例如本实验有4个类别,就分别创建四个文件。将每个类别的数据放到对应类别的目录中。

 

 

 

3. classes.txt

分别有两列,第一列是分类的文件名,就是上二级目录文件名,第二列是对应类别。

 

 

4. test.txt

test文件就是存放测试集数据,第一列就是存放一级目录对应下来的文件相对路径。第二列就是对应的类别。

 

 可以通过下程序自动写入

import os

# test文件夹对应路径
test_path = '/media/test'
test_txt = 'test.txt'
dirlist = os.listdir(test_path)
with open(test_txt, 'w') as f:  # 如果filename不存在会自动创建, 'w'表示写数据,写之前会清空文件中的原有数据!
    for i in os.listdir(test_path):
        print(i)
        for ii in os.listdir(os.path.join(test_path, i)):
            print(i+'/'+ii+" "+i)
            f.writelines(i+'/'+ii+" "+i+"\n")
f.close()
print("success")

至此,Imagenet数据集就制作完成了。

 

posted @ 2022-09-29 16:42  咖啡陪你  阅读(497)  评论(0编辑  收藏  举报