当有多个features时,无法通过图像来评估hypothesis
当我们的hypothesis只有一个features时,可以通过观察它的图像来看它是否overfitting,但是如果我们有多个features的情况下,就无法通过画出图形来看是否overfitting.我们需要另一种方法来评估我们的函数。
评估hypothesis的标准方法
这儿我们将我们的Dataset分成两部分,一部分用来做为training set(70%),一部分用来做为Test set(30%),mtest表示test example的个数。
注意这个7/3分是针对随机排列的数据来分的,如果数据之间有一定的顺序的话,则应先将这些数据打乱后(随机分布),取前70%为training set,后30%为test set.
如果数据本来就是随机分布的(没有一定的顺序),则将前70%做为training set,后30%做为test set。
评估hypothesis的标准方法:For linear regression
1>我们从之前分的training data中求得parameter Θ
2>用求得的hypothesis来计算test set error, linear regression的test set error计算公式如上图所示。
评估hypothesis的标准方法: For logistic regression
1>先从training data(70%的data set)中求得parameter Θ
2> 用求得的hypothesis来计算test set error, logistic regression的test set error计算公式如上图所示Jtest(Θ)=...
3>另一种代替test set error的方法是Misclassification error也叫(0/1 misclassification error),如果误分类了,则err为1,正确分类的话,则为0;计算公式如上图所示Test error = .....