使用KFold交叉验证方法划分训练集和验证集

在进行深度学习时，为了提高精度，或者为了评估我们模型的优劣，以及如何选择一个更好的模型。这样我们就需要用到交叉验证方法。

我们主要实现如何使用KFold划分训练集和验证集

复制代码

#coding:utf-8
from sklearn.model_selection import KFold
def select_train_val(all_path, seed):
    kfold = KFold(5, shuffle=True, random_state=seed)
    splits = list(kfold.split(patients_dir))
    train_datasets = []
    val_datasets = []
    for n in range(0, fold_number):
        train_idx, val_idx = splits[n]
        print("first idx of train", train_idx[0])
        print("first idx of test", val_idx[0])
        train = [patients_dir[i] for i in train_idx]
        val = [patients_dir[i] for i in val_idx]
    return train_datasets, val_datasets
if __name__ == "__main__":
    from glob import glob
    path = r"/home/wpx/BraTS2019/Train/*"
    all_file = glob(path)
    # 这是获取到5折对应的训练集和验证集，我们如果只是的用来划分训练集和验证集，我们最终可以随机选择某一折，比如选第一折划分好的训练集和验证集，可以这样操作：
    #train_data, val_data = train_dataset[1], val_dataset[1]
    train_dataset, val_dataset = select_train_val(all_file,1234)

复制代码

posted @ 2022-04-19 16:44 九叶草阅读(505) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 过拟合一些解决方案

· 主要将子文件下大量图片进行路径编号，并保存到csv文件当中。方便直接从文件读取图片路径以及其他图片信息

· 机器学习笔记：sklearn交叉验证之KFold与StratifiedKFold

· sklearn中的KFold简单介绍

· K折交叉验证

阅读排行：
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后，我竟然真的恢复了删除的微信聊天记录！
· 没有Manus邀请码？试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix

公告

昵称：九叶草
园龄： 7年6个月
粉丝： 10
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

文章分类

医学智能(2)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:利用3Dslice提取血管中心线
@qq3382 我可以打开的，你被墙了吧。...
--九叶草
2. Re:利用3Dslice提取血管中心线
这个教程打不开了，已经没了，楼主还能找到吗？急救用，希望楼主能卡到并回复。
--qq3382
3. Re:三维医学图像深度学习，数据增强方法（monai）：RandHistogramShiftD, Flipd, Rotate90d
@一生热爱9 我不是太清楚这个错误，但是这个错误好像是sitk过程中出现的，你看看你的输入是否是3D图像。我的输入是3D图像，即：3dIrcadb这个数据集中的数据。...
--九叶草
4. Re:三维医学图像深度学习，数据增强方法（monai）：RandHistogramShiftD, Flipd, Rotate90d
sitk::ERROR: Length of input (16) does not match matrix dimensions (3, 3).
请问您有没有这个错误啊
--一生热爱9
5. Re:python安装sklearn
@Gygert 复制下载链接到迅雷，当然我用的谷歌浏览器可以复制下载链接的。其他浏览器不清楚...
--回忆瞬间