Fork me on GitHub
摘要: 摘要 由于生成高分辨率图像较为缓慢且复杂,基于Transformer的文本到图像模型的发展阻碍。在这项工作中,研究者提出了一种基于分层Transformer和局部并行自回归生成的解决方案。研究者预训练了一个60亿参数的transformer模型,采用简单灵活的司监督任务、跨模态通用语言模型(CogL 阅读全文
posted @ 2022-05-31 19:58 stardsd 阅读(618) 评论(0) 推荐(0) 编辑