摘要: 这一节是Andrew对应用机器学习给出的建议,虽然没有数学公式,但却是十分重要的一课。 Debugging Learning Algorithms 假设要做一个垃圾邮件分类的模型,已经从海量的词汇表中选出一个较小的词汇子集(100个单词)作为特征。 用梯度上升算法实现了贝叶斯逻辑回归,但测试集的错误 阅读全文
posted @ 2015-04-05 22:49 Logos 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 稍微了解有监督机器学习的人都会知道,我们先通过训练集训练出模型,然后在测试集上测试模型效果,最后在未知的数据集上部署算法。然而,我们的目标是希望算法在未知的数据集上有很好的分类效果(即最低的泛化误差),为什么训练误差最小的模型对控制泛化误差也会有效呢?这一节关于学习理论的知识就是让大家知其然也知其所 阅读全文
posted @ 2015-04-05 17:54 Logos 阅读(121) 评论(0) 推荐(0) 编辑