李宏毅-分类

  1. 为什么不能用回归代替分类?

    答:因为回归与分类对模型评估的好坏定义不一样。当训练集出现异常点时,回归会尽量去拟合这些异常点,增加模型鲁棒性。但是在分类中,异常点的出现会使得分割界偏离最优位置,原本可能并不是这个类别的异常点当成该类别进行模型训练,导致模型不准确。

   2. 分类问题,预测随机抓一个神奇宝贝属于某一类别的概率(朴素贝叶斯公式):

    

    p(c1)表示一群神奇宝贝中,类别1的宝贝概率(占比)。p(x|c1)表示,在类别1中抓一只神奇宝贝是x的概率,这个没有直接告诉。视频中,老师以水系宝贝为例,以防御力和特殊防御力为两个坐标轴,将水系宝贝在这个坐标轴中是按照高斯分布进行分布的。从手中已有的神奇宝贝资料(什么东西<400),可以拟合出一个高斯分布函数,即求得高斯分布的方差和平均值,然后放入新的神奇宝贝,得到一个新的高斯函数值,这个函数值与从该类别中获取该宝贝的概率成正比,因此看成p(x|c1)。

    上面提到的用一个高斯分布函数代替概率值,其实相当于该种类宝贝的分布概率是一个高斯分布。因为高斯分布有一个中心点,当宝贝分布位置越靠近这个点,它就越可能属于这个类别,而越靠近这个中心点的高斯函数值越大,也就表示高斯函数值越大属于该类别的概率就越大。

    怎样得到一个最好的高斯分布函数来拟合训练集?

      

 

posted @ 2019-04-14 21:07  去冰七分糖  阅读(217)  评论(0编辑  收藏  举报