随笔分类 - EDA
探索性数据分析
摘要:分析数据集中 train 集的每个类别的 bboxes 数量分布情况。因为训练集分了两个:train1,train2。先根据两个数据集的 anno_train.json 文件分析类别分布。数据集:布匹瑕疵检测数据集-阿里云天池 (aliyun.com) 数据集 bbox数量 缺陷图片数量 正常图片数
阅读全文
摘要:EDA目的:通过了解数据集的分布情况,数据之间的关系,来帮我们更好的后期进行特征工程和建立模型。 本文主要是一个根据coco数据集格式的json文件,来分析数据集中图片尺寸,宽高比,bbox尺寸,宽高比,以及每张图片中bbox数量的分布情况。 分析的数据集来自:零基础入门CV - 街景字符编码识别赛
阅读全文