随笔分类 - 机器学习
摘要:先说结论,model.state_dict()是浅拷贝,返回的参数仍然会随着网络的训练而变化。应该使用deepcopy(model.state_dict()),或将参数及时序列化到硬盘。 再讲故事,前几天在做一个模型的交叉验证训练时,通过model.state_dict()保存了每一组交叉验证模型的
阅读全文
摘要:当模型需要接受多个模态的数据时,往往需要设计合适的方法让他们能进行信息的融合,Joint embedding是一种较为普遍的思路,即将他们映射到同一个向量空间中,再进行融合。 向量拼接、元素级相乘、做out product得到矩阵、求和。缺点是缺乏表达能力 Multimodal Compact Bi
阅读全文
摘要:在Windows上使用Dataloader并设置num_workers为一个非零数字,enumerate取数据时会引发"EOFError: Ran out of input"的报错。解决方法是num_workers=0。
阅读全文
摘要:Linear Discriminant Analysis(线性判别分类器)是对费舍尔的线性鉴别方法(FLD)的归纳,属于监督学习的方法。 LDA的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距
阅读全文
摘要:在resize矩阵时出现报错 很可能是矩阵未设置为float,应该在读入后转换类型
阅读全文
摘要:loss的获取 在看别人代码的时候发现都是 在想为什么不直接使用loss呢,因为pytorch使用Variable跟踪变量(4.0后合并为Tensor),也就是直接使用loss,那么pytorch认为其还在参与运算,其在一个batch后依旧存在于网络中而不是释放掉,所以资源占用会越来越大。 最新版本
阅读全文
摘要:numpy数组增加维度 比如二维灰度图片转化成三维带channel的数组
阅读全文