超参数调优——google Vizier采用迁移学习的思想,主要是从之前调参的经验中学习,为新算法提出最佳超参数

Google使用一套超参数调优算法来烘焙更美味的饼干“超参数调优”和“烘焙饼干”这两件事情,乍一听感觉风马牛不相及,但细想一下,似乎又有一定的相似之处——“黑盒优化”。结构复杂的深度学习模型某种程度上就是一个黑盒,为实现更好的优化目标,我们不断进行“超参数调优”来优化这个黑盒。烘焙饼干似乎也是类似的过程,为了烘焙出更好吃的饼干,厨师们往往需要调节诸如醒面时间、烘焙温度、烘焙时长等超参数,而最后到底是哪些因素让饼干更好吃谁也说不清楚,这不也是“黑盒优化”嘛。之前大公司解决超参数调优问题的最好方法被戏称为“博士生下降法”(即让博士生人工调整梯度下降法的参数)。后来,Google为了解决公司内部大量机器学习模型的调优问题,开发了一套超参数调优系统,被称作GoogleVizier。GoogleVizier采用迁移学习的思想,主要是从之前调参的经验中学习,为新算法提出最佳超参数。在搭建好GoogleVizier后,Google的工程师们为了测试他们的算法,向Google食堂制作饼干的承包商提供了饼干食谱和烘焙方法,并不断对结果进行了口味测试。在经过几轮测试和烘焙方法调优之后,饼干确实更好吃了……继AlphaGo击败了围棋选手之后,全世界的厨师们也许已经在GoogleVizier面前瑟瑟发抖。


posted @ 2021-08-05 16:26  bonelee  阅读(421)  评论(0编辑  收藏  举报