风过蔷薇

导航

 

2018年1月14日

摘要: 过拟合问题 过拟合:当我们有太多的 feature 时, hypothesis 可能对训练集 fit 得非常好,但是对于新的测试数据可能会预测不准确。通常由生成了大量与数据无关的不必要曲线和角的复杂函数引起的。 欠拟合:明显有些数据不符合模型,通常由太简单的函数或者太少的 feature 引起的。 阅读全文
posted @ 2018-01-14 23:02 风过蔷薇 阅读(262) 评论(0) 推荐(0) 编辑
 
摘要: 损失函数(Cost function) 不能使用跟线性回归一样的损失函数,因为那样会使输出曲线是波浪形的,导致其不适合凸函数,有很多局部最优值。 线性回归的损失函数是这样的: 当 y = 1 时,J(θ) 的图是这样的: 当 y = 0 时,J(θ) 的图如下: 如果 y 为0, 如果 hθ(x) 阅读全文
posted @ 2018-01-14 14:32 风过蔷薇 阅读(164) 评论(0) 推荐(0) 编辑
 
摘要: 分类 分类问题无法用线性函数来表达,分类问题更像一个只有很少离散值的回归问题。 这里我们聚焦在只有两个值(0或者1)的二元分类问题上。 Hypothesis 函数 对于分类问题,我们用 Sigmoid 函数(即逻辑函数)作为 hypothesis 函数 Sigmoid函数的曲线图如下: 函数 g(z 阅读全文
posted @ 2018-01-14 12:32 风过蔷薇 阅读(259) 评论(0) 推荐(0) 编辑