encoder-decoder读书摘要
文本生成相关文章,还不错,看一下
《文本生成系列之encoder-decoder》
https://mp.weixin.qq.com/s/ZSf5XUfq3LyjUtai2XVyAQ
文本生成是自然语言处理领域一种常见的任务,它实现了从源文本到目标文本之间的转换。
应用于包括机器翻译(Machine Translation),文本简化(Text Simplification),文本摘要(Document Summarization)等更具体的场景,在不同具体的场景可能有所差异,但是底层的技术基本共通。
文本生成的模型结构有多种形式,本文主要介绍其中的encoder-decoder这种架构的,通过一个encoder对源文本进行编码,然后再通过一个decoder按顺序进行预测输出。
在实际应用中发现用LSTM或者GRU来替代RNN作为encoder或者decoder效果会更好,也可以使用attention机制来动态更新每个时刻的源文本表征。
T5
T5相信大家多多少少都曾听过它的名字,它在模型结构上并没有多少创新,更多是是给整个NLP预训练模型领域提供一个通用的框架,把所有NLP的任务都转化成文本到文本的格式中去。无论是分类模型,还是回归等等各种任务,统统转化为文本生成任务。
3.4 Bart
除了模型结构外,论文作者尝试了多种损坏文本的方式,包括Token Masking(随机选取token进行Mask), Token Deletion(随机删除token),Sentence Permutation(随机调整句子之间的顺序),Document Rotation(随机以某个token翻转顺序),Text Infilling(随机将一个片段替换为Mask),最后发现使用Sentence Permutation跟Text Infilling效果最好。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2018-02-16 这道题目还是很难得- 剑指Offer - 正则表达式
2018-02-16 剑指Offer - 做过的一道题目- 之字形打印
2018-02-16 剑指Offer - 做出来了- 字符流中第一个不重复的字符
2018-02-16 哇,好厉害,做出来啦 - 剑指Offer - 找出排序二叉树中第K大的节点
2018-02-16 剑指Offer - 经典的按照行来打印节点
2018-02-16 好厉害啊 - 剑指Offer - 二叉树的下一个结点
2018-02-16 又做出来一道题目 - 不错的 - 想了一会儿- 剑指Offer - 对称的二叉树