李燕

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2016年1月25日

摘要: skewed classesskewed classes: 一种类里面的数量远远高于(或低于)另一个类,即两个极端的情况。预测cancer的分类模型,如果在test set上只有1%的分类误差的话,乍一看是一个很好的结果,实际上如果我们将所有的y都预测为0的话(即都不为cancer),分类误差为0.... 阅读全文
posted @ 2016-01-25 21:45 李燕 阅读(482) 评论(0) 推荐(0) 编辑

摘要: Error analysis--让我们系统的去判断我们接下来要做什么,而不是随机的,凭直觉地选择一个去做我们在设计机器学习应用时,刚开始使用简单(简单的features)的算法来很快的完成它,它可能并不完美,不能很好的解决我们的问题。然后在交叉验证集上来检验这个算法。然后通过画出学习曲线(判断是hi... 阅读全文
posted @ 2016-01-25 17:43 李燕 阅读(500) 评论(0) 推荐(0) 编辑