06 2022 档案

摘要:pytorch: cpp_extension 作者:elfin 资料来源:C++扩展接口 项目地址:https://github.com/firstelfin/torch_extension ​ 深度学习中,我们常使用pytorch的python接口实现一些非官方实现的逻辑,我们可能会拼接一些官方的 阅读全文
posted @ 2022-06-28 18:11 巴蜀秀才 阅读(2228) 评论(0) 推荐(1) 编辑
摘要:DyHead: 基于注意力机制的目标检测头 作者:elfin 资料来源:DyHead 论文:https://arxiv.org/pdf/2106.08322.pdf 代码:https://github.com/microsoft/DynamicHead 一、摘要 ​ 目标检测中定位和分类相结合的复杂 阅读全文
posted @ 2022-06-18 15:18 巴蜀秀才 阅读(13057) 评论(0) 推荐(1) 编辑
摘要:Masked Autoencoders Are Scalable Vision Learners 作者:elfin 资料来源:MAE MAE模型第一次在arxiv上发表是2021年11月11日,截止2022年6月15日,大佬发布的最后一版是V3发布日期是2021年12月19日。 论文:https:/ 阅读全文
posted @ 2022-06-16 10:38 巴蜀秀才 阅读(2789) 评论(0) 推荐(0) 编辑
摘要:Swin Transformer V2: Scaling Up Capacity and Resolution 作者:elfin 资料来源:Swin V2 论文地址: https://arxiv.org/abs/2111.09883 如V2名字所言,这里增大了模型的冗余和输入的分辨率! V1论文解析 阅读全文
posted @ 2022-06-14 18:09 巴蜀秀才 阅读(2532) 评论(0) 推荐(0) 编辑
摘要:损失出现NaN可能有三种情况: 计算过程中出现除数为0的情况,这种情况可以进行平滑处理,如果是计算书写错误就相应更改即可; 计算过程中带入空数据,如一个空张量,后续计算会出现NaN,而且这时梯度可能会正常更新,直到多次累积后出现爆炸的情况; 数值精度溢出,如fp16精度不够表示的数值,溢出后就表示为 阅读全文
posted @ 2022-06-07 16:46 巴蜀秀才 阅读(1032) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示