为了尝试分类,一种方法是使用线性回归,并将所有大于0.5的预测映射为1,所有小于0.5作为0。然而,这种方法不能很好地工作,因为分类实际上不是线性函数。

分类问题和回归问题一样,除了我们现在要预测的值y只取一小部分离散值。现在,我们将重点讨论二进制分类问题,其中Y只能接受两个值,0和1。(我们在这里所说的大部分也将推广到多类情况)。

 

例如,如果我们试图为电子邮件构建一个垃圾邮件分类器,那么x(i)可能是一封电子邮件的一些特征,如果是垃圾邮件,y可能是1,否则为0。因此,Y∈{0,1}。0也被称为否定类,1是正类,它们有时也用符号“-”和“+”表示。给定x(i),相应的y(i)也被称为训练示例的标签。

posted on 2017-07-23 16:36  郑哲  阅读(110)  评论(0编辑  收藏  举报