摘要: 转自:here 注意下面说的全局最优是特殊的情况,一般还是梯度下降的方法还是很容易变成局部最优。 梯度下降(GD)是最小化风险函数、损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路,下面从公式的角度对两者进行分析。 下面的h(x)是要拟合的函数,J(theta)损失函数,thet 阅读全文
posted @ 2017-03-28 17:39 chenhuan001 阅读(462) 评论(0) 推荐(0) 编辑
摘要: 做了下阿里的编程测试题,就30分钟,不是正常的输入输入,直接给一个数组作为输入。 于是带想题和处理数据花了20分钟,最后10分钟搞一个dij模版, 竟然只过了66%,应该是我数组开小了。 题目数据量没给,也没有说明是单组读入还是多组, 感觉dfs O(M)的复杂度应该没有问题。 纪录一下,把一个字符 阅读全文
posted @ 2017-03-28 09:35 chenhuan001 阅读(885) 评论(0) 推荐(1) 编辑