李燕

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

当有多个features时,无法通过图像来评估hypothesis

当我们的hypothesis只有一个features时,可以通过观察它的图像来看它是否overfitting,但是如果我们有多个features的情况下,就无法通过画出图形来看是否overfitting.我们需要另一种方法来评估我们的函数。

评估hypothesis的标准方法

 

这儿我们将我们的Dataset分成两部分,一部分用来做为training set(70%),一部分用来做为Test set(30%),mtest表示test example的个数。

注意这个7/3分是针对随机排列的数据来分的,如果数据之间有一定的顺序的话,则应先将这些数据打乱后(随机分布),取前70%为training set,后30%为test set.

如果数据本来就是随机分布的(没有一定的顺序),则将前70%做为training set,后30%做为test set。

评估hypothesis的标准方法:For linear regression

1>我们从之前分的training data中求得parameter Θ

2>用求得的hypothesis来计算test set error, linear regression的test set error计算公式如上图所示。

评估hypothesis的标准方法: For logistic regression

1>先从training data(70%的data set)中求得parameter Θ

2> 用求得的hypothesis来计算test set error, logistic regression的test set error计算公式如上图所示Jtest(Θ)=...

3>另一种代替test set error的方法是Misclassification error也叫(0/1 misclassification error),如果误分类了,则err为1,正确分类的话,则为0;计算公式如上图所示Test error = .....

 

posted on 2015-12-14 21:46  李燕  阅读(790)  评论(0编辑  收藏  举报