摘要: 来源知乎 计算模型:hadoop-MapReduce,Spark-DAG(有向无环图)评注:经常有人说Spark就是内存版的MapReduce,实际上不是的。Spark使用的DAG计算模型可以有效的减少Map和Reduce人物之间传递的数据,尤其适合反复迭代的机器学习场景。而Hadoop则更擅长批处 阅读全文
posted @ 2017-08-02 20:24 simple_wxl 阅读(312) 评论(0) 推荐(0) 编辑
摘要: maxout的拟合能力是非常强的,它可以拟合任意的的凸函数。最直观的解释就是任意的凸函数都可以由分段线性函数以任意精度拟合(学过高等数学应该能明白),而maxout又是取k个隐隐含层节点的最大值,这些”隐隐含层"节点也是线性的,所以在不同的取值范围下,最大值也可以看做是分段线性的(分段的个数与k值有 阅读全文
posted @ 2017-08-02 17:30 simple_wxl 阅读(806) 评论(0) 推荐(0) 编辑
摘要: 稀疏解的作用:内存和时间啊 实际的互联网广告应用需要的是快速地进行model的更新。为了保证快速的更新,训练样本是一条一条地过来的,每来一个样本,model的参数对这个样本进行一次迭代,从而保证了model的及时更新,这种方法叫做OGD(Online gradient descent)。 传统Bat 阅读全文
posted @ 2017-08-02 16:49 simple_wxl 阅读(927) 评论(0) 推荐(0) 编辑