06 2022 档案
摘要:pytorch: cpp_extension 作者:elfin 资料来源:C++扩展接口 项目地址:https://github.com/firstelfin/torch_extension 深度学习中,我们常使用pytorch的python接口实现一些非官方实现的逻辑,我们可能会拼接一些官方的
阅读全文
摘要:DyHead: 基于注意力机制的目标检测头 作者:elfin 资料来源:DyHead 论文:https://arxiv.org/pdf/2106.08322.pdf 代码:https://github.com/microsoft/DynamicHead 一、摘要 目标检测中定位和分类相结合的复杂
阅读全文
摘要:Masked Autoencoders Are Scalable Vision Learners 作者:elfin 资料来源:MAE MAE模型第一次在arxiv上发表是2021年11月11日,截止2022年6月15日,大佬发布的最后一版是V3发布日期是2021年12月19日。 论文:https:/
阅读全文
摘要:Swin Transformer V2: Scaling Up Capacity and Resolution 作者:elfin 资料来源:Swin V2 论文地址: https://arxiv.org/abs/2111.09883 如V2名字所言,这里增大了模型的冗余和输入的分辨率! V1论文解析
阅读全文
摘要:损失出现NaN可能有三种情况: 计算过程中出现除数为0的情况,这种情况可以进行平滑处理,如果是计算书写错误就相应更改即可; 计算过程中带入空数据,如一个空张量,后续计算会出现NaN,而且这时梯度可能会正常更新,直到多次累积后出现爆炸的情况; 数值精度溢出,如fp16精度不够表示的数值,溢出后就表示为
阅读全文