摘要:
##Seq2Seq 2014年Google Brain团队提出基于深度学习的Seq2Seq模型。如图1所示,该模型在结构上主要分为两部分:编码器Encoder、解码器Decoder。Encoder部分使用某一深度学习神经网络读取输入关键字或句子,将关键字或句子压缩到一个固定的维度;Decoder部分 阅读全文
摘要:
##一、Word2vec简介 一个将词表示为含有语义信息的向量的模型。 一段文本——> 向量表示——>含有语义信息的向量表示。 例如: 输入:自然 语言 处理 包含 很多 ##二、CBoW ###CBoW原理图 通过上下文预测中间词。设置窗口为2,根据同中心词距离不超过2的背景词,生成中心词。即根据 阅读全文
摘要:
##一、RNN的网络结构 ##二、前向传播 假定隐藏单元的激活函数是tanh,输出是离散的。表示离散变量的常规方式是把输出O作为每个离散变量可能值的非标准化对数概率。然后经softmax函数处理后,获得标准化后概率的输出向量$\hat$。RNN从特定的初始状态$h^{\left ( 0 \right 阅读全文
摘要:
##RNN简介 循环神经网络的主要用途是处理和预测序列数据。 ##RNN的网络结构 ###1、循环神经网络的经典结构 从网络结构上,循环神经网络会记忆之前的信息,并利用之前的信息影响后面节点的输出。 参数共享思想:由于模块A中的运算和变量在不同时刻是相同的,因此循环神经网络理论上可以看作是同一神经网 阅读全文
摘要:
##题目描述 给定一个二维的矩阵,包含 'X' 和 'O'(字母 O)。 找到所有被 'X' 围绕的区域,并将这些区域里所有的 'O' 用 'X' 填充。 ##示例 X X X X X O O X X X O X X O X X 运行你的函数后,矩阵变为: X X X X X X X X X X X 阅读全文
摘要:
##语言模型的评价方法 常用的语言模型效果好坏的评价指标是复杂度(perplexity)。在测试集上得到的perplexity越低,说明模型的效果越好。 perplexity的公式如下: Perplexity值刻画的是语言模型预测一个语言样本的能力。比如已经知道某句话会出现在语料库中,那么通过语言模 阅读全文
摘要:
##一、推荐系统的结构 一个完整的推荐系统往往具有三个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。 用户模型:用户模型的主要作用是构建用户画像,系统通过对用户在web页面的浏览、点击、评论等行为,手机APP的使用,GPS定位等,分析、计算用户的喜好特征,进而形成用户画像。 推荐对象模型 阅读全文
摘要:
##Wide&Deep简介 Wide&Deep模型是Wide Models和Deep Models的结合。Wide Models使用的更多的是人工特征以及一些交互特征(主要有稀疏数据产生),具有较多的经验和稀疏数据产生的记忆;Deep Models是对稀疏特征的变换,通过深度神经网络的挖掘,可以得到 阅读全文
摘要:
##PNN https://www.cnblogs.com/wisteria68/p/13472777.html ##Wide&Deep https://www.cnblogs.com/wisteria68/p/13474578.html ##FM https://www.cnblogs.com/w 阅读全文
摘要:
##一、PNN的网络结构图 ##二、PNN的网络结构介绍 ###1、Input Input是经过one-hot之后的数据,数据比较稀疏。 ###2、Embedding Layer Pair-wisely Connected 通过Embedding Layer将高维稀疏的数据,转换为低维稠密的数据,这 阅读全文