摘要: [TOC] > Yolov3取消池化和全连接层,全部由53个卷积层组成,又名Darknet53,采用多scale,每个scale包含三种候选框,对不同的特征图进行融合后再预测(感受野大的上采样后与感受野相对较小的融合)。利用coco数据集对模型进行训练,最后返回物体所在位置以及物体的类别(回归和分类 阅读全文
posted @ 2023-08-01 15:44 Frommoon 阅读(58) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 相较于传统目标检测,DETR是一种纯端到端的网络。它不再需要NMS(非极大值抑制,用于去除多余的预测框)和生成anchor。首先,使用一个CNN抽取图片的特征,将这个特征拉平并加入位置编码信息;其次,将拉平后的特征送入Transformer的encoder学全局特征;然后,由deco 阅读全文
posted @ 2023-07-29 20:12 Frommoon 阅读(173) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 本文根据传入的用户对电影的评分以及电影的类型数据,首先电影和用户作为图的点,根据电影的类型作为电影的特征,用户则通过embedding映射成向量作为特征,用户对电影的评分作为边,再通过torch_geometric把单向边转换为双向边,也就是异构图(点的类型多种,边的类型多种)。最后 阅读全文
posted @ 2023-07-27 15:52 Frommoon 阅读(386) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 本文把每一件商品看做一个点,session_id表示用户,每个用户的浏览购买物品形成一张图。把每个点都embedding成128维的向量,构建网络结构(其中利用TopKPooling对图做下采样),一个图做一个分类结果,判断买没买(0/1)。 ### 1.查看数据 #### (1)数 阅读全文
posted @ 2023-07-26 17:19 Frommoon 阅读(392) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 根据车辆行驶途中周围物体的变化,预测车辆行驶轨迹。数据集是"Argoverse" ,数据集包含高分辨率地图、传感器数据和车辆状态信息等多种数据类型。 "argoverse-api" 是一个由 Argo AI 公司开发的开源项目,它提供了一个 Python API,用于处理和分析 Ar 阅读全文
posted @ 2023-07-24 16:23 Frommoon 阅读(538) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 本文分别利用全连接层/GCN层实现对2708篇论分(论文之间有引用关系,由此引入图神经网络)进行7分类的任务,通过对比知:利用全连接层的准确率为59%,利用GCN层的准确率为81% #### (1)数据预处理 ``` python from torch_geometric.datas 阅读全文
posted @ 2023-07-23 17:02 Frommoon 阅读(90) 评论(0) 推荐(0) 编辑
摘要: [TOC] > Swim Transformer是特为视觉领域设计的一种分层Transformer结构。Swin Transformer的两大特性是滑动窗口和层级式结构。 1.滑动窗口使相邻的窗口之间进行交互,从而达到全局建模的能力。 2.层级式结构的好处在于不仅灵活的提供各种尺度的信息,同时还因为 阅读全文
posted @ 2023-07-13 17:16 Frommoon 阅读(825) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 本项目根据MRPC数据集,首先对数据进行处理(包括对每句话进行分词操作和编码操作),然后创建BERT模型,接着根据Transformer结构(包括self-attention机制,attention_mask等),最终是二分类任务:判断两句话是否相连(这两句话是否可判断为同一句话), 阅读全文
posted @ 2023-07-07 22:22 Frommoon 阅读(272) 评论(0) 推荐(0) 编辑
摘要: [TOC] > RNN(递归神经网络):前一时刻的特征会对后一时刻产生影响(前一次得到的结果保留,与后一层一起输入)。LSTM网络是RNN的一种变种,相较于RNN他可以过滤掉中间没必要的特征,可以有效地解决RNN的梯度爆炸或者消失问题。 **步骤:** - 本文通过LSTM网络实现对新闻标题进行10 阅读全文
posted @ 2023-05-21 21:51 Frommoon 阅读(558) 评论(0) 推荐(0) 编辑
摘要: [TOC] > 本项目通过训练数据6552条,验证数据818条,通过迁移学习ResNet经典网络架构,实现对102种花的照片进行分类。流程:利用torchvision库中transforms模块进行数据的增强和预处理;然后调用torchvision库中的ResNet经典网络架构,用人家训练好的权重参 阅读全文
posted @ 2023-05-19 17:37 Frommoon 阅读(302) 评论(0) 推荐(0) 编辑