摘要: https://karpathy.github.io/2019/04/25/recipe/ 训练神经网络2个坑 训练神经网络2个leaky abstraction 据说开始训练神经网络很容易。许多库和框架都觉得使用30行代码来解决数据问题很了不起,这给人一种即插即用的(错误的)印象。常见的做法是:在 阅读全文
posted @ 2022-07-11 20:47 哈哈哈喽喽喽 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 教授斯坦福大学CS231n(深度学习)课程的时候,我们在教最基础的反向传播时特意设计了一些需要编写详细计算过程的编程作业。学生们需要用原始的numpy来实现每一层的前向和后向传播步骤。不可避免地,有些学生在课堂留言板上抱怨: “为啥现实世界中的框架,如Tensorflow,已经能帮你自动计算这些,我 阅读全文
posted @ 2022-07-11 20:38 哈哈哈喽喽喽 阅读(33) 评论(0) 推荐(0) 编辑