jasonzhangxianrong

2024年8月28日

摘要： title: "在 Transformers 中使用对比搜索生成可媲美人类水平的文本🤗" thumbnail: /blog/assets/115_introducing_contrastive_search/thumbnail.png authors: - user: GMFTBY transla 阅读全文

posted @ 2024-08-28 13:40 jasonzhangxianrong 阅读(8) 评论(0) 推荐(0) 编辑

2024年8月26日

（十七）使用 T5 Transformer 进行多任务处理的指南

摘要： T5 （Text-to-Text Transfer Transformer）模型是为探索迁移学习的局限性而进行的一项大规模研究（论文）的产物。它建立在 GPT、BERT 和 RoBERTa（仅举几例）模型等流行的架构之上，这些模型利用迁移学习取得了令人难以置信的成功。虽然类似 BERT 的模型可以阅读全文

posted @ 2024-08-26 18:19 jasonzhangxianrong 阅读(109) 评论(0) 推荐(0) 编辑

（十六）提出正确的问题：在新任务中训练 T5 Transformer 模型

摘要：自从 T5（文本到文本传输转换器）问世以来，一直渴望尝试它，早在 2019 年 10 月（已经有几个月了）。我弄乱了几次来自 Google 的开源代码，但我从未设法让它正常工作。其中一些有点超出我的脑海（Tensorflow 😫），所以我想我会等待 Hugging Face 来救援！与往常一样，T 阅读全文

posted @ 2024-08-26 18:11 jasonzhangxianrong 阅读(100) 评论(0) 推荐(0) 编辑

2024年8月25日

Pytorch DDP分布式训练介绍

摘要：近期一直在用torch的分布式训练，本文调研了目前Pytorch的分布式并行训练常使用DDP模式(Distributed DataParallell )，从基本概念，初始化启动，以及第三方的分布式训练框架展开介绍。最后以一个Bert情感分类给出完整的代码例子：torch-ddp-examples。阅读全文

posted @ 2024-08-25 16:14 jasonzhangxianrong 阅读(594) 评论(0) 推荐(1) 编辑

2024年8月21日

修改模型的embedding

摘要： Huggingface | 修改模型的embedding 目标：在NLP领域，基于公开语料的预训练模型，在专业领域迁移时，会遇到专业领域词汇不在词汇表的问题，本文介绍如何添加专有名词到预训练模型。 NLP的处理流程：对输入的句子进行分词，得到词语及下标通过embedding层获得词语对应的em 阅读全文

posted @ 2024-08-21 17:00 jasonzhangxianrong 阅读(70) 评论(0) 推荐(0) 编辑

2024年8月17日

windows编译latex

摘要： cd D:\gpt_academic-master\gpt_log\arxiv_cache\2404.07771\workfolder >pdflatex -shell-escape -interaction=nonstopmode -file-line-error merge_translate_ 阅读全文

posted @ 2024-08-17 19:20 jasonzhangxianrong 阅读(7) 评论(0) 推荐(0) 编辑

2024年7月29日

DiffSeq

摘要：目录概符号说明流程代码 Gong S., Li M., Feng J., Wu Z. and Kong L. DiffuSeq: Sequence to sequence text generation with diffusion models. In International Conf 阅读全文

posted @ 2024-07-29 15:47 jasonzhangxianrong 阅读(16) 评论(0) 推荐(0) 编辑

2024年7月28日

pycharm远程调试一直卡着（正在收集数据），查看变量时一直显示collecting data并报错Timeout waiting for response且看不到任何内容

摘要： 1. 问题描述如题，在用PyCharm进行Python代码调试查看具体变量时，会随机遇到一直显示collecting data，到最后报错Timeout waiting for response，在界面中看不到变量内部的内容，如下图所示： 2. 解决办法在PyCharm，打开Setting界面，在如阅读全文

posted @ 2024-07-28 00:09 jasonzhangxianrong 阅读(205) 评论(0) 推荐(0) 编辑

2024年7月27日

Diffusion|DDPM 理解、数学、代码

摘要： Diffusion论文：Denoising Diffusion Probabilistic Models参考博客open in new window；参考 paddle 版本代码： aistudio 实践链接open in new window该文章主要对 DDPM 论文中的公式进行小白推导，并根据阅读全文

posted @ 2024-07-27 13:44 jasonzhangxianrong 阅读(392) 评论(0) 推荐(0) 编辑

Diffusion|DDIM 理解、数学、代码

摘要： DIFFUSION 系列笔记|DDIM 数学、思考与 ppdiffuser 代码探索论文：DENOISING DIFFUSION IMPLICIT MODELS参考博客open in new window; 参考 aistudio notebook 链接，其中包含详细的公式与代码探索： linko 阅读全文

posted @ 2024-07-27 13:31 jasonzhangxianrong 阅读(425) 评论(0) 推荐(0) 编辑

公告