摘要: Suppose you have trained a logistic regression classifier which is outputinghθ(x).Currently, you predict 1 ifhθ(x)≥threshold, and predict 0 ifhθ(x)<th... 阅读全文
posted @ 2016-01-15 19:37 simplelovecs 阅读(1718) 评论(0) 推荐(0) 编辑
摘要: 首先,使用一个 简单的机器学习算法,尽可能快的实现一个机器学习系统(比如24小时以内),用这个算法在训练集上训练拟合得到一个模型,然后 在验证集上进行验证。 其次,画出 学习曲线图 来判断 是需要 更多的数据,还是需要 抽取、添加更多的特征,还是选择其他机器学习算法等等。 最后,可以人工查看... 阅读全文
posted @ 2016-01-15 17:35 simplelovecs 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 假设我们已经训练得到 一个模型,那么我们怎么直观判断这个 模型的 bias 和 variance? 直观方法: 如果模型的 训练错误 比较大,并且 验证错误 和训练错误 差不多一样,都比较大,我们就认为这个模型 是 高bias 的,或者说 它是 underfit 。 如果模型的 训... 阅读全文
posted @ 2016-01-15 17:08 simplelovecs 阅读(875) 评论(0) 推荐(0) 编辑
摘要: 首先明白一个事实,那就是如果我们在某个训练集上训练拟合得到一个模型,那么显然,这个模型在这个训练集上的训练错误很有可能会比实际上的泛化错误(generalization error)会低(模型overfitting)。 问题来了: 假如我们把数据集分成 训练集 和 测试集。然后,在训练集... 阅读全文
posted @ 2016-01-15 16:08 simplelovecs 阅读(336) 评论(0) 推荐(0) 编辑
摘要: 一、为什么要进行机器学习算法诊断? 如果我们在某个数据集上训练得到一个模型假设 h(X),而当我们将这个模型应用到一个新的数据集上,或者说用这个模型来做预测的时候,发现这个模型的预测错误很大,那么我们应该如何做,采取什么办法来 改善 模型 的性能呢? 办法就是,对算法进行诊断。二、机器学习算法诊... 阅读全文
posted @ 2016-01-15 13:29 simplelovecs 阅读(471) 评论(0) 推荐(0) 编辑