摘要:
原文链接:https://arxiv.org/pdf/1911.06258 Motivation 任务为TextVQA(详情见上一篇推送)。现有模型大多是基于两个模态的结合机制(如问题与图片特征的attention、问题与OCR提取文本的attention等),将TextVQA当做分类任务,并且单步 阅读全文
摘要:
原文链接:https://arxiv.org/pdf/1904.08920 Task VQA (visual question answering) 是视觉推理的一个方向,给定图片和与图片相关的问题,期望得 到问题的答案。现有模型在VQA数据集上效果较好,但在VQA的一个子任务上表现不佳。这个子任务 阅读全文
摘要:
原文链接:https://arxiv.org/pdf/1810.02338.pdf Motivation 本文与上两篇文章相同,即visual reasoning。对于图中问题的回答,人类的推理是清晰而可解释的。visual reasoning希望可以将VQA的推理过程清晰地表现出来。 Struct 阅读全文
摘要:
原文链接:https://arxiv.org/abs/1803.03067 MAC网络是一种新的全可微神经网络架构,目标在于提升推理的表现力。受到计算机架构原则的启发,MAC 不使用传统的神经网络黑箱架构,转而采用了提倡透明性、多用途的设计。 如图,MAC网络组成部分为一个输入神经元、一个核心循环网 阅读全文
摘要:
原文链接:https://arxiv.org/pdf/1705.03633.pdf Visual Reasoning 传统的神经网络常被称为“黑箱”,其完成任务的过程是端到端的,由训练数据经过大量参数拟合直接得到预测结果,这其中的逻辑推理过程是不清晰的。研究者希望能够打破黑箱,探索神经网络在完成VQ 阅读全文
摘要:
原文链接:https://arxiv.org/pdf/1901.07973.pdf DeepFashion2 在服装识别方面,现有的DeepFashion数据集存在问题,比如关键点稀少等,无法适用于现实环境。文章提出DeepFashion2来解决这些问题,可以用于服装检测、姿态估计、分割等。它包含8 阅读全文
摘要:
原文链接: http://openaccess.thecvf.com/content_ECCV_2018/papers/Dian_SHAO_Find_and_Focus_ECCV_2018_paper.pdf Motivation 根据自然语言文本检索视频是当今关键的技术之一。短视频平台的兴起给这项 阅读全文
摘要:
原文链接:https://arxiv.org/pdf/1908.02265.pdf Motivation 预训练+迁移学习(pretrain-then-transfer)是深度学习研究中常用的方法。如果在一个较大的数据集上预训练一个模型,那么完成特定的下游任务时可以使用该模型(简单修改模型结构或用作 阅读全文
摘要:
Lab2代码阅读 wzk 本次文件 queue.h mmu.h pmap.h pmap.c tlb_asm.S queue.h 主要定义了链表的操作,最后两个宏函数是尾队列相关 LIST_HEAD:定义一个指针head指向链表表头 LIST_HEAD_INITIALIZER:通过将head赋值为此来 阅读全文
摘要:
Lab1代码阅读 wzk 文件树 ├── boot │ ├── Makefile │ ├── start.o │ └── start.S ├── drivers │ ├── gxconsole │ │ ├── console.c │ │ ├── console.o │ │ ├── dev_cons. 阅读全文