摘要: Introduction 本文提出了一种基于文本的行人定位并检索的系统,即:给定一个包含多个行人的大场景图像,以及一个行人的对应描述,需要在图像中对描述的行人进行定位以及检索。 Prposed Method 1) 视觉特征: 作者采用Faster R-CNN进行行人检测,检测出的行人候选区域调整为 阅读全文
posted @ 2021-07-02 17:08 橙同学的学习笔记 阅读(304) 评论(0) 推荐(0) 编辑