使用SVM优化包(liblinear,libsvm)来求θ

我们要做得:

1.选择适当的C值

2.选择相应的核函数

 

我们也可以不选择核函数(称为线性核函数)

 

弊端:

如果你有大量的特征变量 如果 n 很大 而训练集的样本数 m 很小 那么 你知道 

你有大量的特征变量 x 是一个 n+1 维向量 x 是一个 n+1 维向量 那么如果你已经有 

大量的特征值 和很小的训练数据集 也许你应该拟合 一个线性的判定边界 

不要拟合非常复杂的非线性函数 因为没有足够的数据 如果你想在一个高维特征空间 

试着拟合非常复杂的函数  而你的训练集又很小的话 你可能会过度拟合 因此 这应该是 

你可能决定不适用核函数 或者等价地说使用线性核函数 或者等价地说使用线性核函数

 的一个合理情况

 

我们选择类似高斯核函数这类核函数:

 

 

编写核函数代码:

 

note:在使用核函数之前,对数据进行归一化

||x-l||可以写成:

 

归一化可以使你的函数不止关注较大的特征值。

 

其他的一些核函数:

 

 

多类分类的方法和逻辑回归分类相似,建立多个分类器

 

逻辑回归和SVM的比较

 

posted on 2017-08-22 18:19  郑哲  阅读(278)  评论(0编辑  收藏  举报