11 2023 档案
摘要:https://mp.weixin.qq.com/s/C5ZDYKPdHazR2bR9I9KFjQ 在之前的文章中,我们介绍过VIT(Vision Transformer) ,它将NLP中常用的Transformer架构用于图像分类的预训练任务上,取得了比肩ResNet的效果,成功证明了Transf
阅读全文
摘要:https://blog.csdn.net/Miller_em/article/details/132025409 如果从官网直接下载ImageNet-1k数据集会非常慢,我这里网速只有几十kb每秒,所以考虑采用百度网盘的方式进行下载。由于使用的是GPU云服务器,没有桌面,无法使用图形界面的百度网盘
阅读全文
摘要:https://mp.weixin.qq.com/s/iL6YitT7EGP6DnrBehb9MQ 1.Adding Conditional Control to Text-to-Image Diffusion Models 论文地址:https://arxiv.org/pdf/2302.05543
阅读全文