随笔分类 -  深度学习

摘要:Paper: 《Learning Transferable Visual Models From Natural Language Supervision》 Code: https://github.com/openai/CLIP 一、大体内容 CLIP(Contrastive Language–I 阅读全文
posted @ 2025-02-28 13:18 半夜打老虎 阅读(12) 评论(0) 推荐(0) 编辑
摘要:前面记录了Detr及其改进Deformable Detr。这一篇记录一下用Detr训练自己的数据集。先看下Detr附录中给出的大体源码,整体非常清晰。 接下来记录大体实现过程 一、数据准备 借助labelme对数据进行标注 然后将标注数据转换成COCO格式,得到以下几个文件 其中JPEGImages 阅读全文
posted @ 2024-12-26 22:13 半夜打老虎 阅读(129) 评论(0) 推荐(0) 编辑
摘要:PDF:https://arxiv.org/pdf/2010.04159 Code:https://github.com/fundamentalvision/Deformable-DETR 一、大体内容 前面介绍DETR时,说明了其还存在对小物体检测效果不佳和训练慢的问题,Deformable DE 阅读全文
posted @ 2024-12-16 17:12 半夜打老虎 阅读(300) 评论(0) 推荐(0) 编辑
摘要:PDF: https://arxiv.org/pdf/2005.12872 Code: https://github.com/facebookresearch/detr 一、大体内容 DETR(DEtection TRansformer)基于Transformer提出了一个全新的端到端的目标检测框架 阅读全文
posted @ 2024-12-06 11:39 半夜打老虎 阅读(250) 评论(0) 推荐(0) 编辑
摘要:一、大体内容 PDF:https://arxiv.org/pdf/2103.14030 CODE:https://github.com/microsoft/Swin-Transformer 前面提出的ViT将Transformer引入到了视觉领域,但其重点解决了分类问题,其采用单一尺度提取特征对后续 阅读全文
posted @ 2024-11-29 16:37 半夜打老虎 阅读(209) 评论(0) 推荐(0) 编辑
摘要:一、大体内容 PDF: https://arxiv.org/abs/2111.06377 CODE: https://github.com/facebookresearch/mae (原文采用tensorflow 和 TPU 没有开源) 前面已经介绍了Transformer、BERT、ViT,这里理 阅读全文
posted @ 2024-11-22 17:19 半夜打老虎 阅读(49) 评论(0) 推荐(0) 编辑
摘要:PDF: https://arxiv.org/abs/2010.11929 CODE: https://github.com/google-research/vision_transformer 一、大体内容 前面介绍了Transformer及其在NLP领域的两大发展方向BERT和GPT,但当时Tr 阅读全文
posted @ 2024-11-14 15:45 半夜打老虎 阅读(78) 评论(0) 推荐(0) 编辑
摘要:前面讲解了GPT、BERT相关内容,这一篇记录剩下GPT-2、GPT-3、GPT-4。 相关资料 GPT1: Improving Language Understanding by Generative Pre-Training GPT2: Language Models are Unsupervi 阅读全文
posted @ 2024-09-27 17:22 半夜打老虎 阅读(136) 评论(0) 推荐(0) 编辑
摘要:前面介绍了Transformer,随着其发展在NLP领域应用越来越多,在其基础上主要有两篇影响非常大的文章,一篇是GPT,另一篇是BERT。OpenAI提出的GPT采用Transformer解码器结构,一路更新迭代到了现在有了GPT-4,而Google提出的BERT采用Transformer的编码器 阅读全文
posted @ 2024-09-12 19:35 半夜打老虎 阅读(244) 评论(0) 推荐(0) 编辑
摘要:Transformer于2017年提出,最开始应用于NLP领域,随着Transformer的快速发展,在视觉领域中也越来越多的论文或应用用到了Transformer,这里记录一下自己学习的一些知识点。 PDF: 《Attention Is All You Need》 Code: attention- 阅读全文
posted @ 2024-09-05 21:26 半夜打老虎 阅读(72) 评论(0) 推荐(0) 编辑
摘要:一、Layer Norm 1.1 介绍 LayerNorm(Layer Normalization)是2016年提出的,随着Transformer等模型的大规模推广,LayerNorm出现频率也随之越来越高。其大体思想类似于BatchNorm,对输入的每个样本进行归一化处理,具体就是计算每个输入的均 阅读全文
posted @ 2024-07-28 14:28 半夜打老虎 阅读(1014) 评论(0) 推荐(1) 编辑
摘要:先前的一些文章简单介绍了一些点云检测和分割的文献资料,可以看出近些年越来越多的方法结合了Transformer,因此有必要说明一下Transformer的结构,在介绍之前需要了解一些知识点:比如Self Attention、Layer Normalization等等,这一篇先简单了解下Self At 阅读全文
posted @ 2024-07-20 09:43 半夜打老虎 阅读(265) 评论(0) 推荐(0) 编辑
摘要:PDF:《Point Transformer V3: Simpler, Faster, Stronger》 CODE: https://github.com/Pointcept/PointTransformerV3 一、大体内容 Point Transformer V3(PTv3)没有像V2那样在注 阅读全文
posted @ 2024-07-10 21:37 半夜打老虎 阅读(643) 评论(0) 推荐(0) 编辑
摘要:PDF: 《Point Transformer V2: Grouped Vector Attention and Partition-based Pooling》 CODE: https://github.com/Gofinge/PointTransformerV2 一、大体内容 前面一篇文章介绍了 阅读全文
posted @ 2024-07-03 21:03 半夜打老虎 阅读(565) 评论(0) 推荐(0) 编辑
摘要:PDF: 《Point Transformer》 CODE: https://github.heygears.com/POSTECH-CVLab/point-transformer 一、大体内容 Point Transformer基于自注意力网络实现网络模型的构建。通过设计针对点云的自注意力层,结合 阅读全文
posted @ 2024-06-26 23:27 半夜打老虎 阅读(611) 评论(0) 推荐(0) 编辑
摘要:PDF:《PointConv: Deep Convolutional Networks on 3D Point Clouds》 CODE: https://github.com/DylanWusee/pointconv 一、大体内容 PointConv是一种在非均匀采样下对3D点云进行卷积的运算,可 阅读全文
posted @ 2024-06-18 23:22 半夜打老虎 阅读(240) 评论(0) 推荐(0) 编辑
摘要:前面介绍了采用OpenPCDet架构和自定义数据集训练了pointRCNN模型,也已经跑通了测试流程,但在实际应用过程中通常需要把模型导出成ONNX格式,然后借助其他框架用C++进行推理。这里记录一下pointRCNN导出流程以及常见的一些错误。其大体分为以下几步: 弄清楚数据流 确定网络架构 改写 阅读全文
posted @ 2024-06-02 15:44 半夜打老虎 阅读(372) 评论(0) 推荐(0) 编辑
摘要:前面介绍了3D目标检测的一些综述文献,这一篇接着介绍两篇3D分割的综述文献。第一篇是23年的《Deep Learning Based 3D Segmentation: A Survey》,第二篇是19年的《Deep Learning for 3D Point Clouds: A Survey》。第二 阅读全文
posted @ 2024-05-21 21:51 半夜打老虎 阅读(334) 评论(0) 推荐(0) 编辑
摘要:官网也提供了步骤,这里详细介绍下训练自己数据的过程以及中间遇到的一些问题。训练模型这里采用PointRCNN,具体的介绍参考:https://www.cnblogs.com/xiaxuexiaoab/p/18033887 一、准备数据集 数据集这一块我们需要准备好原始点云数据、物体目标标注文件、以及 阅读全文
posted @ 2024-05-15 22:24 半夜打老虎 阅读(1101) 评论(0) 推荐(0) 编辑
摘要:PDF: RSN: Range Sparse Net for Efficient, Accurate LiDAR 3D Object Detection 一、大体内容 现有基于RV图像的方法在遮挡处理、精确的对象定位和尺寸估计方面往往表现不佳,RSN通过结合基于密集距离图像和网格的方法的优势,提高了 阅读全文
posted @ 2024-04-30 14:58 半夜打老虎 阅读(95) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示