07 2023 档案
摘要:[TOC] > 相较于传统目标检测,DETR是一种纯端到端的网络。它不再需要NMS(非极大值抑制,用于去除多余的预测框)和生成anchor。首先,使用一个CNN抽取图片的特征,将这个特征拉平并加入位置编码信息;其次,将拉平后的特征送入Transformer的encoder学全局特征;然后,由deco
阅读全文
摘要:[TOC] > 本文根据传入的用户对电影的评分以及电影的类型数据,首先电影和用户作为图的点,根据电影的类型作为电影的特征,用户则通过embedding映射成向量作为特征,用户对电影的评分作为边,再通过torch_geometric把单向边转换为双向边,也就是异构图(点的类型多种,边的类型多种)。最后
阅读全文
摘要:[TOC] > 本文把每一件商品看做一个点,session_id表示用户,每个用户的浏览购买物品形成一张图。把每个点都embedding成128维的向量,构建网络结构(其中利用TopKPooling对图做下采样),一个图做一个分类结果,判断买没买(0/1)。 ### 1.查看数据 #### (1)数
阅读全文
摘要:[TOC] > 根据车辆行驶途中周围物体的变化,预测车辆行驶轨迹。数据集是"Argoverse" ,数据集包含高分辨率地图、传感器数据和车辆状态信息等多种数据类型。 "argoverse-api" 是一个由 Argo AI 公司开发的开源项目,它提供了一个 Python API,用于处理和分析 Ar
阅读全文
摘要:[TOC] > 本文分别利用全连接层/GCN层实现对2708篇论分(论文之间有引用关系,由此引入图神经网络)进行7分类的任务,通过对比知:利用全连接层的准确率为59%,利用GCN层的准确率为81% #### (1)数据预处理 ``` python from torch_geometric.datas
阅读全文
摘要:[TOC] > Swim Transformer是特为视觉领域设计的一种分层Transformer结构。Swin Transformer的两大特性是滑动窗口和层级式结构。 1.滑动窗口使相邻的窗口之间进行交互,从而达到全局建模的能力。 2.层级式结构的好处在于不仅灵活的提供各种尺度的信息,同时还因为
阅读全文
摘要:[TOC] > 本项目根据MRPC数据集,首先对数据进行处理(包括对每句话进行分词操作和编码操作),然后创建BERT模型,接着根据Transformer结构(包括self-attention机制,attention_mask等),最终是二分类任务:判断两句话是否相连(这两句话是否可判断为同一句话),
阅读全文