医学数据集整理
1. LAScarQS 2022数据集
- LAScarQS2022是一个专门针对房颤(Atrial Fibrillation, AF)患者的晚期钆增强(Late gadolinium enhancement, LGE)MRI 数据集,旨在对左心房(Left Atrial, LA)及左心房疤痕(LA Scar)进行精确分割。挑战赛分为两个任务,任务 1 目标是同时分割 LA 和 LA Scar,数据都是经过消融后的 LGE MRI,包括 60 例训练集和 34 例测试集。任务 2 目标仅分割 LA,数据既有消融前也有消融后的 LGE MRI,包括 130 例训练集和 64 例测试集,测试集中包含未知域的数据。下载地址:https://zmiclab.github.io/projects/lascarqs22/data.html
2. CT-ORG2020数据集
- CT-ORG2020是一个CT多器官分割数据集,官方提供了6种器官的标注:肺,骨头,肝脏,肾脏,膀胱和大脑,包含 140 例 CT ,数据集划分为 119 例训练集和 21 例测试集。下载地址:
https://faspex.cancerimagingarchive.net/aspera/faspex/external_deliveries/259?passcode=caf2906b2acd7345a7f275ba96475214dc0c1bf9#
3. SegTHOR2020数据集
- SegTHOR2020是一个专门用于胸部风险器官(OARs)分割的 CT 数据集,即在放疗过程中需要避免受到辐射的围绕肿瘤的器官。风险器官包括心脏、气管、主动脉和食管,该数据集包括 60 例 CT影像,其中 40 例用于训练,20 例用于测试。下载地址:
https://competitions.codalab.org/competitions/21145#learn_the_details-dataset
4. ATLAS2022数据集
- ATLAS v2.02022是一个从 MR T1 加权 (T1W) 单模态图像中对脑中风病灶区域进行分割的数据集。ATLAS v2.0 提供了 1271 例图像。其中,955 例为公开图像,分为 655 例训练集图像和 300 例带有隐藏标注的测试集图像;另外,还有 316 例来自新的未公开过的图像。下载地址:http://fcon_1000.projects.nitrc.org/indi/retro/atlas_download.html
5. ISLES2022数据集
- ISLES2022旨在通过多模态 MR 影像(包括 FLAIR、DWI 和 ADC)自动分割急性至亚急性缺血性中风病变。该数据集汇集了 400 例多中心,多设备的 MRI 病例,这些病例在中风病变的大小、数量和位置上展现了高度的变异性。数据集被分为 250 例的训练集和 150 例的测试集。下载链接:https://zenodo.org/record/7153326
6. AIIB2023数据集
- AIIB2023是一个针对纤维化肺病的气道 CT 影像进行自动分割的数据集。该数据集包括312例数据,其中训练集有 120 例纤维化病例,验证集有 52 例纤维化病例,而测试集则包括 90 例纤维化和 50 例 COVID-19 病例。下载链接:
https://codalab.lisn.upsaclay.fr/competitions/13238#learn_the_details-dataset
7. INSTANCE 2022数据集
- INSTANCE 2022是一个脑部 CT 数据集,用于颅内出血 (ICH) 的分割。数据集包含100例带有真实标签的训练集,以及一个不带真实标签的30例的验证集。另外,70例的测试集被用于最终的评估和排名。下载链接:https://instance.grand-challenge.org/Dataset/
8. ACDC2017数据集
- ACDC2017是对心脏动态磁共振成像 (cine-MRI) 中的舒张期 (ED) 和收缩期 (ES) 帧进行左心室 (LV) 、右心室 (RV) 和心肌 (Myo) 分割。该数据集涵盖 150 个病例,分为 5 个子类:NOR (正常)、MINF (心肌梗死伴随收缩性心力衰竭)、DCM (扩张型心肌病)、HCM (肥厚型心肌病) 和 ARV (右室异常),每类各 30 例。官方将数据划分为 100 例的训练集和 50 例的测试集,每个子类在训练集中有 20 例,在测试集中有 10 例。下载链接:https://humanheart-project.creatis.insa-lyon.fr/database/#collection/637218c173e9f0047faa00fb/folder/637218e573e9f0047faa00fc
9. TDSC-ABUS2023数据集
- TDSC-ABUS2023 数据集专注于自动化 3D 乳房超声 (ABUS) 图像的肿瘤检测、分割和分类。该数据集通过检测、分割和分类的方法来识别肿瘤,并进一步区分其为良性或恶性。下载链接:https://tdsc-abus2023.grand-challenge.org/Dataset/
10. FUMPE2018数据集
- FUMPE2018数据集是一个在计算机断层血管成像(CTA)图像中进行肺栓塞(PE)区域分割的数据集,包含了35名不同患者的图像。下载链接:
https://www.kaggle.com/datasets/andrewmvd/pulmonary-embolism-in-ct-images