https://zhuanlan.zhihu.com/p/23178423
这篇知乎文章讲的比较好,在神经网络权重取平均值和减少神经元之间复杂的共适应关系两个方面分析了为什么dropout可以解决过拟合。
另外关于dropout在测试的时候应该怎么处理的问题,这篇https://www.cnblogs.com/makefile/p/dropout.html博客给出了解释。