pytorch 调参小结

  • learning rate 和keras的参数不一样
    • SGD的在0.5左右
    • Adam的在0.01左右
  • 训练数据一定要打乱 测试数据不用打乱

posted @ 2019-10-29 14:14  FromZeroToOne  阅读(821)  评论(0编辑  收藏  举报