随笔分类 -  深度学习

摘要:很久没有写总结了,这篇博客仅作为最近的一些尝试内容,记录一些心得。FFM的优势是可以处理高维稀疏样本的特征组合,已经在无数的CTR预估比赛和工业界中广泛应用,此外,其也可以与Deep Networks结合(如DeepFM等工作),很好地应用在数据规模足够大的工业场景中。Recurrent Entit 阅读全文
posted @ 2019-05-10 17:01 蓝鲸王子 阅读(586) 评论(0) 推荐(0) 编辑
摘要:在之前的强化学习文章里,我们讲到了经典的MDP模型来描述强化学习,其解法包括value iteration和policy iteration,这类经典解法基于已知的转移概率矩阵P,而在实际应用中,我们很难具体知道转移概率P。伴随着这类问题的产生,Q-Learning通过迭代来更新Q表拟合实际的转移概 阅读全文
posted @ 2019-03-30 16:04 蓝鲸王子 阅读(1839) 评论(0) 推荐(0) 编辑
摘要:在上一篇文章中介绍了MDP与Bellman方程,MDP可以对强化学习的问题进行建模,Bellman提供了计算价值函数的迭代公式。但在实际问题中,我们往往无法准确获知MDP过程中的转移概率P,因此无法直接将解决 MDP 问题的经典思路 value iteration 和 policy iterat 阅读全文
posted @ 2019-03-29 15:00 蓝鲸王子 阅读(3170) 评论(0) 推荐(1) 编辑
摘要:本文主要介绍强化学习的一些基本概念:包括MDP、Bellman方程等, 并且讲述了如何从 MDP 过渡到 Reinforcement Learning。 1. 强化学习基本概念 这里还是放上David Silver的课程的图,可以很清楚的看到整个交互过程。这就是人与环境交互的一种模型化表示,在每个时 阅读全文
posted @ 2019-03-28 16:53 蓝鲸王子 阅读(3981) 评论(0) 推荐(2) 编辑
摘要:一、softmax函数 softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类! 假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值就是: $$ S_i = \frac{e^j }{ \sum\nolimits 阅读全文
posted @ 2018-07-09 18:53 蓝鲸王子 阅读(3557) 评论(0) 推荐(2) 编辑
摘要:A Survey of Model Compression and Acceleration for Deep Neural Networks 一、研究背景 在神经网络方面,早在上个世纪末,Yann LeCun等人已经使用神经网络成功识别了邮件上的手写邮编。至于深度学习的概念是由Geoffrey H 阅读全文
posted @ 2018-05-09 16:25 蓝鲸王子 阅读(16748) 评论(1) 推荐(0) 编辑
摘要:损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可 阅读全文
posted @ 2017-12-02 10:41 蓝鲸王子 阅读(19578) 评论(1) 推荐(2) 编辑
摘要:1. 比较一般的自定义函数: 需要注意的是,不能像sklearn那样直接定义,因为这里的y_true和y_pred是张量,不是numpy数组。示例如下: 用的时候直接: 2. 比较复杂的如AUC函数: AUC的计算需要整体数据,如果直接在batch里算,误差就比较大,不能合理反映整体情况。这里采用回 阅读全文
posted @ 2017-11-15 16:39 蓝鲸王子 阅读(11266) 评论(2) 推荐(0) 编辑
摘要:word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神 阅读全文
posted @ 2017-11-09 10:44 蓝鲸王子 阅读(2228) 评论(0) 推荐(2) 编辑
摘要:前言 近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整个自然语言领域最核心和关键的部分。而机器翻译评价对于机器翻译的研究和发展具有重要意义:机器翻译系统的开发者可以通过评测得知系统存在的问题而不断改进,用户也可以根据评测报告选择满足自己需求的产品,而对于机器翻译的研究人员 阅读全文
posted @ 2017-11-07 18:28 蓝鲸王子 阅读(2784) 评论(0) 推荐(0) 编辑
摘要:导读 目前采用编码器-解码器 (Encode-Decode) 结构的模型非常热门,是因为它在许多领域较其他的传统模型方法都取得了更好的结果。这种结构的模型通常将输入序列编码成一个固定长度的向量表示,对于长度较短的输入序列而言,该模型能够学习出对应合理的向量表示。然而,这种模型存在的问题在于:当输入序 阅读全文
posted @ 2017-09-22 10:32 蓝鲸王子 阅读(44952) 评论(5) 推荐(11) 编辑
摘要:循环神经网络(RNN) 人们的每次思考并不都是从零开始的。比如说你在阅读这篇文章时,你基于对前面的文字的理解来理解你目前阅读到的文字,而不是每读到一个文字时,都抛弃掉前面的思考,从头开始。你的记忆是有持久性的。 传统的神经网络并不能如此,这似乎是一个主要的缺点。例如,假设你在看一场电影,你想对电影里 阅读全文
posted @ 2017-09-21 22:02 蓝鲸王子 阅读(1757) 评论(0) 推荐(0) 编辑
摘要:矩阵奇异值的物理意义是什么?如何更好地理解奇异值分解?下面我们用图片的例子来扼要分析。 矩阵的奇异值是一个数学意义上的概念,一般是由奇异值分解(Singular Value Decomposition,简称SVD分解)得到。如果要问奇异值表示什么物理意义,那么就必须考虑在不同的实际工程应用中奇异值所 阅读全文
posted @ 2017-09-21 20:04 蓝鲸王子 阅读(3596) 评论(0) 推荐(0) 编辑
摘要:前言: CNN作为DL中最成功的模型之一,有必要对其更进一步研究它。虽然在前面的博文Stacked CNN简单介绍中有大概介绍过CNN的使用,不过那是有个前提的:CNN中的参数必须已提前学习好。而本文的主要目的是介绍CNN参数在使用bp算法时该怎么训练,毕竟CNN中有卷积层和下采样层,虽然和MLP的 阅读全文
posted @ 2017-09-21 10:35 蓝鲸王子 阅读(886) 评论(0) 推荐(0) 编辑
摘要:本文主要是学习下Linear Decoder已经在大图片中经常采用的技术convolution和pooling,分别参考网页http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial中对应的章节部分。 Linear Decoders: 阅读全文
posted @ 2017-09-21 10:23 蓝鲸王子 阅读(556) 评论(0) 推荐(0) 编辑
摘要:在神经网络中,激活函数决定来自给定输入集的节点的输出,其中非线性激活函数允许网络复制复杂的非线性行为。正如绝大多数神经网络借助某种形式的梯度下降进行优化,激活函数需要是可微分(或者至少是几乎完全可微分的)。此外,复杂的激活函数也许产生一些梯度消失或爆炸的问题。因此,神经网络倾向于部署若干个特定的激活 阅读全文
posted @ 2017-09-21 09:57 蓝鲸王子 阅读(3035) 评论(0) 推荐(2) 编辑
摘要:1. 深度学习流程简介 1)一次性设置(One time setup) - 激活函数(Activation functions) - 数据预处理(Data Preprocessing) - 权重初始化(Weight Initialization) - 正则化(Regularization:避免过拟合 阅读全文
posted @ 2017-09-21 09:53 蓝鲸王子 阅读(1758) 评论(0) 推荐(0) 编辑
摘要:引言 拿到这份文档时想必你的脑海中一直萦绕着这么一个问题,“机器学习/深度学习要怎么学呢?(怎么入门,又怎么进一步掌握?)”。关于这个问题其实并没有一个标准答案,有的人可能适合自底向上的学,也就是先从理论和数学开始,然后是算法实现,最后再通过一些项目去解决生活中的实际问题;有的人则可能适合自顶向下的 阅读全文
posted @ 2017-09-20 19:07 蓝鲸王子 阅读(2586) 评论(0) 推荐(1) 编辑
摘要:1.原始版本 最早的卷积方式还没有任何骚套路,那就也没什么好说的了。 见下图,原始的conv操作可以看做一个2D版本的无隐层神经网络。 附上一个卷积详细流程: 【TensorFlow】tf.nn.conv2d是怎样实现卷积的? - CSDN博客 代表模型: LeNet:最早使用stack单卷积+单池 阅读全文
posted @ 2017-09-17 17:26 蓝鲸王子 阅读(1233) 评论(0) 推荐(0) 编辑
摘要:拉格朗日乘数法(Lagrange Multiplier Method)之前听数学老师授课的时候就是一知半解,现在越发感觉拉格朗日乘数法应用的广泛性,所以特意抽时间学习了麻省理工学院的在线数学课程。新学到的知识一定要立刻记录下来,希望对各位博友有些许帮助。 拉格朗日乘数法(Lagrange Multi 阅读全文
posted @ 2017-09-16 20:47 蓝鲸王子 阅读(1176) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示