摘要: 发表在 ACL 2020 属于文本迁移中的半监督方法 动机 现有的平行语料很少,而神经网络含有大量参数需要训练学习,这时需要更多的平行语料提供更多有用的信息,因此,作者针对 formal 风格迁移任务提出了三种数据增强方法,来获得更多有用的句子对 方法 Back Translation 机器翻译中很 阅读全文
posted @ 2020-09-17 19:15 -费费 阅读(446) 评论(0) 推荐(0) 编辑
摘要: 将一系列核心特征转换成分类器可接收的特征向量。即输入 x 两种方案 独热编码(one-hot) 每个特征都用单独一维来表示(其中只有一维值为1,其余维为0) 特点:维度高、且很稀疏,向量维度与不同特征的数目相同,特征空间完全相互独立 稠密编码 每个核心特征都被嵌入到 d 维空间中,并用空间中的一个向 阅读全文
posted @ 2020-08-04 15:39 -费费 阅读(415) 评论(0) 推荐(0) 编辑
摘要: 学习笔记 基于深度学习的自然语言处理(中文版)-- 车万翔 等译 基本概念 在语言处理中,向量 x 来源于文本数据,能够反映文本数据所具有的多种语言学特征 从文本数据到具体向量的映射称为 “特征提取” 和 “特征表示”,通过 “特征方程” 所完成 对语言数据,其以一些列离散的符号形式存在,这个序列需 阅读全文
posted @ 2020-08-02 18:27 -费费 阅读(1038) 评论(0) 推荐(0) 编辑
摘要: 发表在 ICML 2018 动机 深度隐变量模型 VAE 和 GAN 在连续结构上表现很好,但应用到离散结构(如文本序列或离散图像)上却表现较差,在此篇论文中,作者针对此提出了一个灵活的方法来训练深度隐变量模型。 方法 基于之前提出的 WAE(Wasserstein Autoencoder,将对抗性 阅读全文
posted @ 2020-07-25 21:12 -费费 阅读(626) 评论(0) 推荐(0) 编辑
摘要: 发表在 NAACL 2019 MOTIVATION 在这之前,对于文本风格迁移后的效果没有一个很好的统一评价指标,因此,这篇文章做了一个总结,基于之前的一些工作提出从 style transfer intensity 、content preservation、 naturalness 这三个方面来 阅读全文
posted @ 2020-07-23 20:58 -费费 阅读(301) 评论(0) 推荐(0) 编辑
摘要: 发表在 NIPS 2017 动机 作者聚焦于非平行语料文本的风格迁移,针对其研究难点:如何将文本内容与属性分离开来,提出假设跨不同文本语料库共享潜在内容分布,并利用潜在表示的精确对齐来执行风格迁移的方法 方法(交叉对齐) \[ x_1、x_2为两个不同域的语料库 \] \[ y_1、y_2 为其对应 阅读全文
posted @ 2020-07-21 19:16 -费费 阅读(698) 评论(0) 推荐(0) 编辑
摘要: 发表在 ICML 2017 动机 AE 和 RNN 很难捕捉到 隐空间的语义表示,因此不适用于从任意hidden层表示形式生成通用文本,而相较于视觉领域,使用深度生成模型(VAEs、GANs、auto-regressive)在文本生成上还有许多的限制,很大情况下是任意的以及不可控的。本篇文章尝试通过 阅读全文
posted @ 2020-07-20 17:19 -费费 阅读(577) 评论(0) 推荐(0) 编辑
摘要: 功能:四舍五入取值,常用在逻辑回归值为 0 或 1 中 def around(a: Union[ndarray, Iterable, int, float], decimals: Optional[int] = 0, out: Optional[ndarray] = None) → Any 参数: 阅读全文
posted @ 2020-07-19 16:57 -费费 阅读(2725) 评论(0) 推荐(0) 编辑
摘要: 在 python 中,与数据类型相关函数及属性有三个: 名称 作用 type() 返回参数的数据类型 dtype() 返回数组中元素的数据类型 astype() 对数据类型进行转换 实例: import numpy as np a = np.arange(5) type(a) Out[4]: num 阅读全文
posted @ 2020-07-19 14:07 -费费 阅读(2681) 评论(0) 推荐(0) 编辑
摘要: 格式化字符串的函数 str.format(),增强了字符串格式化的功能 通过 和 :来代替以前的 % format() 函数可以接收不限个参数,位置可以不按顺序 实例: # 作为拼接字符串进行使用 '{1} {1} {0} {0}'.format("hello", "world") # 'world 阅读全文
posted @ 2020-07-11 10:28 -费费 阅读(535) 评论(0) 推荐(0) 编辑