2020 年 4月 17 日随笔档案 - -Limbo-

2020年4月17日

摘要：原文链接：https://arxiv.org/pdf/1911.06258 Motivation 任务为TextVQA（详情见上一篇推送）。现有模型大多是基于两个模态的结合机制（如问题与图片特征的attention、问题与OCR提取文本的attention等），将TextVQA当做分类任务，并且单步阅读全文

posted @ 2020-04-17 02:06 -Limbo- 阅读(1773) 评论(0) 推荐(0) 编辑

TextVQA and LoRRA

摘要：原文链接：https://arxiv.org/pdf/1904.08920 Task VQA (visual question answering) 是视觉推理的一个方向，给定图片和与图片相关的问题，期望得到问题的答案。现有模型在VQA数据集上效果较好，但在VQA的一个子任务上表现不佳。这个子任务阅读全文

posted @ 2020-04-17 02:02 -Limbo- 阅读(1086) 评论(0) 推荐(0) 编辑

NS-VQA：结合符号推理和神经网络进行视觉问答

摘要：原文链接：https://arxiv.org/pdf/1810.02338.pdf Motivation 本文与上两篇文章相同，即visual reasoning。对于图中问题的回答，人类的推理是清晰而可解释的。visual reasoning希望可以将VQA的推理过程清晰地表现出来。 Struct 阅读全文

posted @ 2020-04-17 01:59 -Limbo- 阅读(604) 评论(0) 推荐(0) 编辑

Compositional Attention Networks for Machine Reasoning

摘要：原文链接：https://arxiv.org/abs/1803.03067 MAC网络是一种新的全可微神经网络架构，目标在于提升推理的表现力。受到计算机架构原则的启发，MAC 不使用传统的神经网络黑箱架构，转而采用了提倡透明性、多用途的设计。如图，MAC网络组成部分为一个输入神经元、一个核心循环网阅读全文

posted @ 2020-04-17 01:57 -Limbo- 阅读(665) 评论(0) 推荐(0) 编辑

Inferring and Executing Programs for Visual Reasoning

摘要：原文链接：https://arxiv.org/pdf/1705.03633.pdf Visual Reasoning 传统的神经网络常被称为“黑箱”，其完成任务的过程是端到端的，由训练数据经过大量参数拟合直接得到预测结果，这其中的逻辑推理过程是不清晰的。研究者希望能够打破黑箱，探索神经网络在完成VQ 阅读全文

posted @ 2020-04-17 01:52 -Limbo- 阅读(515) 评论(0) 推荐(0) 编辑

DeepFashion and Match R-CNN

摘要：原文链接：https://arxiv.org/pdf/1901.07973.pdf DeepFashion2 在服装识别方面，现有的DeepFashion数据集存在问题，比如关键点稀少等，无法适用于现实环境。文章提出DeepFashion2来解决这些问题，可以用于服装检测、姿态估计、分割等。它包含8 阅读全文

posted @ 2020-04-17 01:48 -Limbo- 阅读(1114) 评论(0) 推荐(0) 编辑

FIFO: 基于自然语言查询的视频检索与定位

摘要：原文链接： http://openaccess.thecvf.com/content_ECCV_2018/papers/Dian_SHAO_Find_and_Focus_ECCV_2018_paper.pdf Motivation 根据自然语言文本检索视频是当今关键的技术之一。短视频平台的兴起给这项阅读全文

posted @ 2020-04-17 01:44 -Limbo- 阅读(728) 评论(0) 推荐(0) 编辑

ViLBERT：视觉-语言任务预训练模型

摘要：原文链接：https://arxiv.org/pdf/1908.02265.pdf Motivation 预训练+迁移学习（pretrain-then-transfer）是深度学习研究中常用的方法。如果在一个较大的数据集上预训练一个模型，那么完成特定的下游任务时可以使用该模型（简单修改模型结构或用作阅读全文

posted @ 2020-04-17 01:37 -Limbo- 阅读(5672) 评论(0) 推荐(0) 编辑

OS Lab2 Code Review

摘要： Lab2代码阅读 wzk 本次文件 queue.h mmu.h pmap.h pmap.c tlb_asm.S queue.h 主要定义了链表的操作，最后两个宏函数是尾队列相关 LIST_HEAD：定义一个指针head指向链表表头 LIST_HEAD_INITIALIZER：通过将head赋值为此来阅读全文

posted @ 2020-04-17 01:18 -Limbo- 阅读(368) 评论(0) 推荐(0) 编辑

OS Lab1 Code Review

摘要： Lab1代码阅读 wzk 文件树 ├── boot │ ├── Makefile │ ├── start.o │ └── start.S ├── drivers │ ├── gxconsole │ │ ├── console.c │ │ ├── console.o │ │ ├── dev_cons. 阅读全文

posted @ 2020-04-17 01:17 -Limbo- 阅读(254) 评论(0) 推荐(0) 编辑

Limbo's Blog

公告