Fork me on GitHub

机器学习策略——DeepLearning.AI课程总结

一、什么是ML策略

假设你正在训练一个分类器,你的系统已经达到了90%准确率,但是对于你的应用程序来说还不够好,此时你有很多的想法去继续改善你的系统:

  • 收集更多训练数据
  • 训练集的多样性不够,收集更多的具有多样性的实验数据和更多样化的反例集。
  • 使用梯度下降法训练更长的时间
  • 尝试一个不同的优化算法,例如Adam优化算法。
  • 尝试更大的神经网络或者更小的神经网络
  • 尝试dropout
  • 尝试L2正则化
  • 改变神经网络的结构:
    1. 修改激活函数
    2. 改变隐藏单元的数目

如果你使用了错误的方向,不仅会浪费大量的时间,而且不会有所改善.

二、正交化

正交性或正交性是一种系统设计属性,它确保修改指令或算法的组成部分不会对系统的其他组件产生或传播副作用。独立地验证算法变得更加容易,它减少了测试和开发的时间。

当一个受监督的学习系统在设计时,这四个假设必须是正确的和正交的。

Chain of assumptions in ML

  1. 成本函数在训练集上有好的表现(Fit training set well on cost function.)
    • 对于一些应用而言,这可能意味着要达到人类水平的表现
    • 如果它不合适,那么使用更大的神经网络或者切换到更好的优化算法可能会有所帮助。
  2. 成本函数在开发集上有好的表现(Fit dev set well on cost function.)
    • 如果不合适,规范化(Regularization)或使用更大的训练集可能会有所帮助
  3. 成本函数在测试集上有好的表现(Fit test set wel on cost function.)
    • 如果不合适,使用更大的开发集可能会有所帮助。
  4. 在实际系统中表现良好(Performs well in real world.)
    • 如果性能不好,开发测试集分布设置不正确,或者成本函数测量的尺度不正确.

posted @   郭耀华  阅读(522)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端
点击右上角即可分享
微信分享提示