分类 - 郑哲 - 博客园

为了尝试分类，一种方法是使用线性回归，并将所有大于0.5的预测映射为1，所有小于0.5作为0。然而，这种方法不能很好地工作，因为分类实际上不是线性函数。

分类问题和回归问题一样，除了我们现在要预测的值y只取一小部分离散值。现在，我们将重点讨论二进制分类问题，其中Y只能接受两个值，0和1。（我们在这里所说的大部分也将推广到多类情况）。

例如，如果我们试图为电子邮件构建一个垃圾邮件分类器，那么x⁽ⁱ⁾可能是一封电子邮件的一些特征，如果是垃圾邮件，y可能是1，否则为0。因此，Y∈{0,1}。0也被称为否定类，1是正类，它们有时也用符号“-”和“+”表示。给定x⁽ⁱ⁾，相应的y⁽ⁱ⁾也被称为训练示例的标签。

posted on 2017-07-23 16:36 郑哲阅读(110) 评论(0) 编辑收藏举报