day2021_9_18

今日内容

  • 西瓜书第二章节,几种评估方法和性能度量的几个度量名词的学习

  • 评估方法有“留出法”、“交叉验证法”以及“自助法”(适合样本较小的情况)

  • 交叉验证法:将数据集D分成k份大小相同的训练集/测试集。比如第一次取第一份作为测试集,其他k-1份作为
    训练集,第二次取第二份作为测试集,其他k-1份作为训练集,以此类推,一直到第k次取到第k份作为测试集,其他k-1份作为训练集。
    好处:所有的数据都参与了测试与训练,而且针对每一次来说,测试与训练的数据并没有相交,最后结果取均值,泛化能力较强

  • 自助法适用于小样本的原因
    自助法:对一个具有m个样本的集合D进行采样,采样大小为D',随机采样m次,就可以得到m个D'大的样本,这样一直有不被采到的概率是(1-m)^m。
    所以我们可以得到m个训练样本,且有约1/3的数据没在训练集中出现,可以用于测试。

  • 性能度量有均方误差、错误率跟精度,后面又引入了查准率、查全率等

遇到的问题

  • 最主要的还是容易遗忘,今天差不多把西瓜书第二章节看完。当时感觉还可以,结果临睡前回顾了一下还是忘了很多

明天计划

  • 到网上找一些视频辅助学习,提高学习效率,还是针对西瓜书的学习。
posted @ 2021-09-18 23:04  闲伯  阅读(12)  评论(1编辑  收藏  举报