11.11

一. 单选题（共2题，40分）

1. (单选题)在评价模型的性能时，一般是更希望算法模型的（）

A. 训练误差小
B. 测试误差小
C. 泛化误差小
D. 以上都是

我的答案: D:以上都是;

2. (单选题)算法模型“过拟合”会发生的现象有（）

A. 训练误差很小，泛化性能差
B. 测试误差很大，泛化性能强
C. 训练误差很大，泛化性能强
D. 测试误差很小，泛化性能强

我的答案: A:训练误差很小，泛化性能差;

二. 简答题（共1题，20分）

3. (简答题)简述划分出测试集的三种方法留出法、交叉验证法和自助法的优劣。

我的答案：

留出法优点实现简单，易于理解；快速，适合大型数据集；缺点：1结果不稳定，因为性能评估依赖于一次划分，存在偶然性； 2浪费数据，部分数据仅用于测试而不是训练；

交叉验证：优点：1.提供更可靠的性能评估。通过多次训练和测试，结果通常更稳定而且具有代表性。2.更有效地利用数据，所有数据在多个实验中由于训练和测试。缺点：计算开销大；

自助法：优点：1.利用随机抽样，能够从有限的数据中生成许多训练集和测试集的组合，

2.适合小型数据集，能有效评估模型性能

缺点1.可能倒是哦训练集和测试集存在重叠，因为样本时有放回的抽样，这可能倒是模型评估的偏差；2.数据利用率较低。

三. 多选题（共1题，20分）

4. (多选题)评估模型时，划分测试集的原则有（）

A. 测试集应该尽可能与训练集互斥
B. 训练集和测试集的划分要尽可能保持数据分布一致（分层采样）
C. 一般采用多次重复试验
D. 以上都不对

我的答案: AB:测试集应该尽可能与训练集互斥; 训练集和测试集的划分要尽可能保持数据分布一致（分层采样）;

四. 填空题（共1题，20分）

5. (填空题)十折交叉验证法中把数据集分成（）份，（）份作为测试集，剩余的（）作为训练集，需要把（）次的过程测试结果平均作为最终的测试结果。

我的答案：: (1) 10; (2) 1; (3) 9; (4) 10

posted @ 2024-11-11 17:10 晨观夕阅读(6) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 11.12

· 12.25

· 每日总结16

· 划分出测试集的三种方法

· 《机器学习》学习记录 - 第二章

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义

公告

昵称：晨观夕
园龄： 1年11个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

wcy1111

11.11

一. 单选题（共2题，40分）

1. (单选题)在评价模型的性能时，一般是更希望算法模型的（）

2. (单选题)算法模型“过拟合”会发生的现象有（）

二. 简答题（共1题，20分）

3. (简答题)简述划分出测试集的三种方法留出法、交叉验证法和自助法的优劣。

三. 多选题（共1题，20分）

4. (多选题)评估模型时，划分测试集的原则有（）

四. 填空题（共1题，20分）

5. (填空题)十折交叉验证法中把数据集分成（）份，（）份作为测试集，剩余的（）作为训练集，需要把（）次的过程测试结果平均作为最终的测试结果。

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论