diffusion扩散模型\datawhale组队学习——v2-抄别人代码还要矫情一下
如果想学diffusion,又没有买纸质书咋办捏?
datawhale为我们提供了大佬的中文笔记!
学习来源:
https://relph1119.github.io/my-team-learning/#/diffusion_models_learning51/ch03/ch03
甚至比看github的代码还方便。
但是又不得不矫情一下,跟着做还有点问题。(小弟就不放大佬的笔记了,下面只有遇到的问题与解决的办法)
为了节省阅读时间,以下内容:
安装一个diffuser库(可能有点用)——第三第四章的运行环境前置安装
读代码的废话(完全没用)
首先,这些公式完全看不懂。希望懂得朋友读到这里能帮忙解释一下。
最下面的“优化目标公式”,是啥意思,为啥没有min,还能求最小值呢?难道目标是让L最小?
第二, 实战第一步卡死,环境准备缺失
笔记中:
实际上:我diffuser呢?
解决办法:
随后第一段就通过了。但只是colab通过。本地又不行,如果有时间再研究本地。colab挺好用的。
第四章问题一样,而且这里可能不得不用colab,因为第四章后面要登陆huggingface,一次FQ就OK。
代码相关的废话:
第三章:只能看明白中间的加噪,还有模型的去噪效果。如何训练的不懂。而且也没有体现公式原理啥的,训练是函数执行的。
画图prompt:
A cool cybernetic cat,glowing neon fur,bionic eyes,mechanical tail,urbanbackground,cityscape reflections,high-tech,glitchy cyberpunk,metallic sheen,electricblue,urban glow,nighttime,chromatic aberration,vivid cyber colors,streetlight reflections.(best quality,4k,8k,highres,masterpiece:1.2),ultra-detailed,(realistic,photorealistic,photo-realistic:1.37),HDR,UHD,studio lighting,ultra-fine painting,sharp focus,physically-basedrendering,extreme detail description,professional,bokeh.
乱七八糟。
因为没有负面提示词,会随机产出各种奇怪的东西
a cut cat in a cyberpunk city, high details
也是不行
full body, long shot, a cate in a cyberpunk city, ....忘了
效果也一般。
但也是矮子里面挑高个了。