1 2 3 4 5 ··· 33 下一页
摘要: 近期一直在用torch的分布式训练,本文调研了目前Pytorch的分布式并行训练常使用DDP模式(Distributed DataParallell ),从基本概念,初始化启动,以及第三方的分布式训练框架展开介绍。最后以一个Bert情感分类给出完整的代码例子:torch-ddp-examples。 阅读全文
posted @ 2024-08-25 16:14 jasonzhangxianrong 阅读(1) 评论(0) 推荐(0) 编辑
摘要: Huggingface | 修改模型的embedding 目标: 在NLP领域,基于公开语料的预训练模型,在专业领域迁移时,会遇到专业领域词汇不在词汇表的问题,本文介绍如何添加专有名词到预训练模型。 NLP的处理流程: 对输入的句子进行分词,得到词语及下标 通过embedding层获得词语对应的em 阅读全文
posted @ 2024-08-21 17:00 jasonzhangxianrong 阅读(3) 评论(0) 推荐(0) 编辑
摘要: cd D:\gpt_academic-master\gpt_log\arxiv_cache\2404.07771\workfolder >pdflatex -shell-escape -interaction=nonstopmode -file-line-error merge_translate_ 阅读全文
posted @ 2024-08-17 19:20 jasonzhangxianrong 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 目录 概 符号说明 流程 代码 Gong S., Li M., Feng J., Wu Z. and Kong L. DiffuSeq: Sequence to sequence text generation with diffusion models. In International Conf 阅读全文
posted @ 2024-07-29 15:47 jasonzhangxianrong 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 1. 问题描述如题,在用PyCharm进行Python代码调试查看具体变量时,会随机遇到一直显示collecting data,到最后报错Timeout waiting for response,在界面中看不到变量内部的内容,如下图所示: 2. 解决办法在PyCharm,打开Setting界面,在如 阅读全文
posted @ 2024-07-28 00:09 jasonzhangxianrong 阅读(11) 评论(0) 推荐(0) 编辑
摘要: Diffusion论文:Denoising Diffusion Probabilistic Models参考博客open in new window;参考 paddle 版本代码: aistudio 实践链接open in new window该文章主要对 DDPM 论文中的公式进行小白推导,并根据 阅读全文
posted @ 2024-07-27 13:44 jasonzhangxianrong 阅读(139) 评论(0) 推荐(0) 编辑
摘要: DIFFUSION 系列笔记|DDIM 数学、思考与 ppdiffuser 代码探索论文:DENOISING DIFFUSION IMPLICIT MODELS参考 博客open in new window; 参考 aistudio notebook 链接,其中包含详细的公式与代码探索: linko 阅读全文
posted @ 2024-07-27 13:31 jasonzhangxianrong 阅读(57) 评论(0) 推荐(0) 编辑
摘要: Wasserstein GAN and the Kantorovich-Rubinstein Duality From what I can tell, there is much interest in the recent Wasserstein GAN paper. In this post, 阅读全文
posted @ 2024-07-26 22:02 jasonzhangxianrong 阅读(8) 评论(0) 推荐(0) 编辑
摘要: Enhancing Diffusion Models with Reinforcement Learning Sep 27, 2023 | Uncategorized TL;DR Today we're going to tell you all about DRLX - our library f 阅读全文
posted @ 2024-07-24 23:21 jasonzhangxianrong 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 摘要 在基本理解着证据下界和VAE后,学习VDM,主要是想自己理解顺畅整个模型的思路和推导过程(done)。 内容组织: 首先从宏观感受VDM的模型架构,并与HVAE进行比较,基本理解; 然后讲解自己理解的整个模型建模过程和原因(《事后诸葛》,为了自己理解); 指出VDM的三个重要等价解释,着重Sc 阅读全文
posted @ 2024-07-24 17:18 jasonzhangxianrong 阅读(12) 评论(0) 推荐(0) 编辑
1 2 3 4 5 ··· 33 下一页