机器学习课程笔记 (1)

Concept Learning

  • supervised, eager learning
  • target problem: whether something belongs to the target concept or not

Find-S Algorithm

这个算法得到的是对于数据集最贴切的描述。

优点:

  • 这个算法的 output 一定是最符合 positive 的训练数据集,只要训练数据都正确,output 也同样符合 negative 的训练数据集。

缺点:

  • 对于训练数据中的噪音十分敏感,如果训练数据中含有错误数据,最后得出的 output 会受到很大的影响。
  • 不能保证只有这一种 output 符合训练数据。可能有很多种描述都符合,但这个算法只会得出一种。

Candidate-Elimination Algorithm

相对于 Find-S,这个算法得出两个假设,一个是最贴近数据集的,一个是最 general 的。

posted @ 2018-03-27 03:02  Erin.ma  阅读(118)  评论(0编辑  收藏  举报