摘要:
Error analysis--让我们系统的去判断我们接下来要做什么,而不是随机的,凭直觉地选择一个去做我们在设计机器学习应用时,刚开始使用简单(简单的features)的算法来很快的完成它,它可能并不完美,不能很好的解决我们的问题。然后在交叉验证集上来检验这个算法。然后通过画出学习曲线(判断是hi... 阅读全文
摘要:
prioritizing what to work on设计一个机器学习算法时,我们应该先做什么?以垃圾邮件识别的例子为例:垃圾邮件发送者可能会故意将一些字符写错,如上图中的Medicine用1来代替i,M0rgages中o用0来代替。我们有一些标识为Spam的邮件,有一些标识为non-spam的邮... 阅读全文
摘要:
怎么区分哪些措施对我们有用呢?----首先根据learning curve来判断你的问题是high bias or variance当你的算法是high bias问题时,如果你get more training examples是没有用处的,这时我们就不要浪费时间在get5 more trainin... 阅读全文
摘要:
画learning curves可以用来检查我们的学习算法运行是否正常或者用来改进我们的算法,我们经常使用learning cruves来判断我们的算法是否存在bias problem/variance problem或者两者皆有。learning curves--m(trainning size与... 阅读全文
摘要:
Linear regression with regularization当我们的λ很大时,hθ(x)≈θ0,是一条直线,会出现underfit;当我们的λ很小时(=0时),即相当于没有做regularization,会出现overfit;只有当我们的λ取intermediate值时,才会刚刚好。那... 阅读全文
摘要:
我们的函数是有high bias problem(underfitting problem)还是 high variance problem(overfitting problem),区分它们很得要,因为有助于我们提升我们的预测准确性。bias problem(underfitting proble... 阅读全文
摘要:
假设我们现在想要知道what degree of polynomial to fit to a data set 或者 应该选择什么features 或者 如何选择regularization parameterλ我们该如何做?----Model selection process很好的拟合trai... 阅读全文
摘要:
当有多个features时,无法通过图像来评估hypothesis当我们的hypothesis只有一个features时,可以通过观察它的图像来看它是否overfitting,但是如果我们有多个features的情况下,就无法通过画出图形来看是否overfitting.我们需要另一种方法来评估我们的... 阅读全文
摘要:
在设计机器学习系统时,一些建议与指导,让我们能明白怎么选择一条最合适,最正确的道路。当我们要开发或者要改进一个机器学习系统时,我们应该接下来做些什么?try smaller sets of features--是为了防止overfitting.当你发现你的预测方法不能成功预测时,接下来你该尝试些什么... 阅读全文
摘要:
如何选择神经网络的architectureinput units和output units都很好决定,关于hidden layer的层数,则一般来说是选择一个hidden layer, 或者>1的hidden layer,但是每个hidden layer都有相同的units.通常来说hidden l... 阅读全文