03 2025 档案
摘要:参数优化 优化 在"Improved Denoising Diffusion Probabilistic Models"一文中,作者提出了多种DDPM的技巧。其中一种就是把 的线性机制改为余弦机制。机制函数的实现相对灵活,只要保证在训练中间过程提供近似线性的
阅读全文
摘要:无监督领域自适应(UDA) 任务描述: 现有两个数据集 源域 和目标域 的经验分布不一样,但是任务是相同的。 任务是利用源域中已有的知识(标签信息)去学习目标域的样本类别。 直观感受 如现在有两堆数据,一堆事真实的动物照片,一堆是手绘动物的照片。两个数据集的风格明显不一样,他们的分布
阅读全文
摘要:过拟合问题 欠拟合:根本原因是特征维度过少,模型过于简单,导致拟合的函数无法满足训练集,误差较大; 解决方法:增加特征维度,增加训练数据; 过拟合:根本原因是特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。 过度的拟合了
阅读全文
摘要:简单来看:Causal learning = To learn causal models/features from data Causal research 里包括两种重要问题,一种是Causal learning,另一种是Causal reasoning(不同的文献有不同的分法和叫法,这里用J
阅读全文
摘要:生成对抗网络 背景 一般而言,深度学习模型可以分为判别式模型与生成式模型。由于反向传播、dropout等算法的发明,判别式模型得到了迅速发展。然而,由于生成式模型建模较为困难,因此发展缓慢,直到近年来最成功的生成模型--生成式对抗网络的发明,这一领域才换发新的生机。 简介 GAN是一种深度学习模型,
阅读全文
摘要:相关系数和特征选择 相关系数和特征选择,一个是属性,一个是特征。一般,把数据集中的各列成为属性,而对算法模型表现有益的属性成为特征。例如,在预测泰坦尼克乘客的存活情况时,乘客姓名这个属性对我们的预测可能没有帮助,甚至会干扰模型表现;而乘客年龄、性别或许与存活情况有很强的关系,这时,可以称他们为特征。
阅读全文
摘要:Pytorch-Lightning 可以在Pytorch的库Pytorch-lightning中找到我们在这里讨论的每一个优化。Lightning是在Pytorch之上的一个封装,它可以自动训练,同时让研究人员完全控制关键的模型组件。Lightning使用最新的最佳实践,并将你可能出错的地方最小化。
阅读全文
摘要:数据切片 数据切片,又被称为数据分片,是一种在处理大规模数据集时,将数据划分为多个较小部分的方法。这种方法可以让我们更有效地处理和分析数据,尤其是在处理大规模数据集时,数据切片技术可以显著提高处理速度和效率。 数据切片技术的主要目的是提高数据处理的速度和效率,同时保证数据的完整性和一致性。数据切片可
阅读全文
摘要:with torch.no_grad() 在深度学习的世界里,模型训练与评估是两个相互独立却又紧密相连的过程。训练时我们需要梯度来更新模型参数,但在评估阶段,梯度计算则称为了不必要的负担。with torch.no_grad()正是为此而生 它允许我们在不记录梯度的情况下执行前向传播,从而节省内存并
阅读全文