2016 年 1月 15 日随笔档案 - simplelovecs

2016年1月15日

一道关于 precision、recall 和 threshold关系的机器学习题

摘要： Suppose you have trained a logistic regression classifier which is outputinghθ(x).Currently, you predict 1 ifhθ(x)≥threshold, and predict 0 ifhθ(x)<th... 阅读全文

posted @ 2016-01-15 19:37 simplelovecs 阅读(1718) 评论(0) 推荐(0) 编辑

机器学习系统设计的推荐指导方法

摘要：首先，使用一个简单的机器学习算法，尽可能快的实现一个机器学习系统（比如24小时以内），用这个算法在训练集上训练拟合得到一个模型，然后在验证集上进行验证。其次，画出学习曲线图来判断是需要更多的数据，还是需要抽取、添加更多的特征，还是选择其他机器学习算法等等。最后，可以人工查看... 阅读全文

posted @ 2016-01-15 17:35 simplelovecs 阅读(206) 评论(0) 推荐(0) 编辑

机器学习模型 bias 和 variance 的直观判断

摘要：假设我们已经训练得到一个模型，那么我们怎么直观判断这个模型的 bias 和 variance？直观方法：如果模型的训练错误比较大，并且验证错误和训练错误差不多一样，都比较大，我们就认为这个模型是高bias 的，或者说它是 underfit 。如果模型的训... 阅读全文

posted @ 2016-01-15 17:08 simplelovecs 阅读(875) 评论(0) 推荐(0) 编辑

机器学习模型的选择

摘要：首先明白一个事实，那就是如果我们在某个训练集上训练拟合得到一个模型，那么显然，这个模型在这个训练集上的训练错误很有可能会比实际上的泛化错误（generalization error）会低（模型overfitting）。问题来了：假如我们把数据集分成训练集和测试集。然后，在训练集... 阅读全文

posted @ 2016-01-15 16:08 simplelovecs 阅读(336) 评论(0) 推荐(0) 编辑

机器学习算法诊断

摘要：一、为什么要进行机器学习算法诊断？如果我们在某个数据集上训练得到一个模型假设 h(X)，而当我们将这个模型应用到一个新的数据集上，或者说用这个模型来做预测的时候，发现这个模型的预测错误很大，那么我们应该如何做，采取什么办法来改善模型的性能呢？办法就是，对算法进行诊断。二、机器学习算法诊... 阅读全文

posted @ 2016-01-15 13:29 simplelovecs 阅读(471) 评论(0) 推荐(0) 编辑

公告