合集-炼丹手册
摘要:最新编辑于:2024年8月30日 一、摘要 fairseq 是个常用的机器翻译项目。它的优化很好,但代码晦涩难懂,限制了我们的使用。 本文旨在梳理如下流程:1)准备 WMT23 的数据 (其余生成任务皆可类比),2)训练模型,3)用 sacrebleu、COMET-22 评测模型。 不想要 wmt
阅读全文
摘要:用accelerate config 生成和 deepspeed相关的参数。 然后参数文件在/home/yuanhang/.cache/huggingface/accelerate/default_config.yaml, 会被自动使用。 用下面这个命令杀掉 wandb 的余孽: ps aux |
阅读全文
摘要:推荐阅读材料 《Tutorial on Variational Autoencoders》 这篇在谷歌上即可搜到,可以说是很详细的解释了VAE涉及的数学知识。 变分自编码器VAE:原来是这么一回事 | 附开源代码 这篇,则用十分直白的白话尝试去理解了VAE设计的思路。 两篇文章应该能解决我们对于VA
阅读全文