diffuser扩散模型\datawhale组队学习——v4.交作业速通unit2.2
《扩散模型从原理到实践》学习手册 - 飞书云文档 (feishu.cn)
本篇文章是对照这篇学习表而跟进的学习笔记,具体而言,进度在这里:实战:创建一个类别条件扩散模型。
!!!!!如果只想交作业的话,把unit2.2的程序,改一个参数,然后全运行就完事了。
这一章节可以直接跑,全都没有问题。
但是遇到一个意外情况,应该不是很常见。
报错说,CUDA error: device-side assert triggered
这可能是因为重复跑相同的模型,也不知道哪里出错了。反正只要重启一下就好了。
还有个很神奇的是,这里的数据名叫“fashionMNIST”,竟然就是一个数据库的函数,或者属性。还以为要在参数里写入FashionMNIST。
换了数据库以后,重新训练很慢。。。又要吃不上热乎的饭了。
听说可以试试调节学习率、batch size 和训练的轮数(epochs)。
感觉都是通过调节训练量和效率,来影响最终结果的。这个逻辑也不错,相当于说,训练参数能对出图质量带来很大一部分提升,也不用考虑其他什么参数了。最后结果如下,感觉比训练集还丑。
参数测试结果,个人感觉差别不大,但明显有个比较浅,有个很深。其他就没啥区别了。三个参数分别是,【epochs,lr(学习率),batch_size】
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构