10 2018 档案

摘要:简单而言,seq2seq由两个RNN组成,一个是编码器(encoder),一个是解码器(decoder).以MT为例,将源语言“我爱中国”译为“I love China”,则定义序列: $$ X=(x_0,x_1,x_2,x_3)\\ 其中,x_0=“我”,x_1=“爱”,x_2=“中”,x_3=“ 阅读全文
posted @ 2018-10-29 17:01 冬色 阅读(1672) 评论(3) 推荐(0) 编辑
摘要:第二章 Tensorflow主要依赖两个工具:Protocol Buffer和Bazel Protocol. Protocol Buffer是一个结构数据序列化的的工具,在Tensorflow中大部分的数据都是通过Protocol Buffer的形式储存,Bazel是谷歌开源的编译工具。 第三章 3 阅读全文
posted @ 2018-10-28 22:42 冬色 阅读(352) 评论(0) 推荐(0) 编辑
摘要:论文地址: "Attention is you need" 序列编码 深度学习做NLP的方法,基本都是先将句子分词,然后每个词转化为对应的的词向量序列,每个句子都对应的是一个矩阵X=(x1,x2,...,xt),其中xi都代表着第i个词向量,维度为d维,故$x\in R^{n×d 阅读全文
posted @ 2018-10-14 22:14 冬色 阅读(1346) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示