2020年11月25日
摘要: ##VSE++: Improving Visual-Semantic Embeddings with Hard Negatives ###1 摘要 受到hard negative mining的启发(在结构化预测中使用hard negative和对loss function进行排序的启发),我们对用 阅读全文
posted @ 2020-11-25 14:54 Justing778 阅读(1055) 评论(0) 推荐(0) 编辑
  2020年11月19日
摘要: ###1 引入 对于上面展示的这一张图,从多种角度来说,可以有多种描述:关注细节的view1、关注地点的view2、忽略所有实体而表达抽象的view3。 所以,对于一张图,我们如何与相应的文本描述对应起来呢? how to align an image to multiple textual des 阅读全文
posted @ 2020-11-19 22:03 Justing778 阅读(405) 评论(0) 推荐(0) 编辑
  2020年11月5日
摘要: ###一 首先,对用户000wangbo的代码进行学习。他的思路是:主干网络resnest200,输入448尺寸,在不同loss下取得5组最好效果,最后进行投票,得到最后分数。 1、进行相关的初始化 np.random.seed(359) torch.manual_seed(359) torch.c 阅读全文
posted @ 2020-11-05 15:13 Justing778 阅读(192) 评论(0) 推荐(0) 编辑
  2020年10月27日
摘要: ###1 摘要 在user-item graph会存在一些用户的隐式反馈(例如,用户不小心点了一个视频,系统会认为用户偏爱这类型的视频),这就导致了在graph产生了false-positive edges,产生了噪声,影响推荐系统的准确性和个性化。 ###2 贡献 探索隐式反馈对基于GCN的推荐模 阅读全文
posted @ 2020-10-27 09:27 Justing778 阅读(469) 评论(0) 推荐(0) 编辑
  2020年10月20日
摘要: ###1 摘要 为了更好的估计微视频所在的场所,这篇论文提出了一个neural multimodal cooperative learning model。 在correlation中区分consistent部分和complementary部分 ###2 引入 对于微视频来说,识别特定的地理信息是非 阅读全文
posted @ 2020-10-20 15:51 Justing778 阅读(287) 评论(2) 推荐(0) 编辑
  2020年9月12日
摘要: ##Part Ⅰ 问题总结 ##Part Ⅱ 生成式对抗网络 ###2.1 用途 旧图像修复 图像超像素 人脸生成 人脸定制 文本生成图片 字体变换 风格变换 帧预测 ###2.2 GAN 生成式对抗网络的目的是训练一个生成模型,生成我们想要的数据。(低维向量-》生成模型-》高维数据(图片、文本、语 阅读全文
posted @ 2020-09-12 21:52 Justing778 阅读(299) 评论(0) 推荐(0) 编辑
  2020年8月22日
摘要: ##绪论 ###1 循环神经网络的应用 视觉问答 语音问答 机器翻译 股票预测 作词机 作诗 模仿写论文 模仿写代码 ###2 循环神经网络vs卷积神经网络 传统神经网络、卷积神经网络,输入和输出之间是相互独立的 RNN可以更好的处理具有时序关系的任务 RNN通过其循环结构引入“记忆”的概念 输出不 阅读全文
posted @ 2020-08-22 13:23 Justing778 阅读(248) 评论(0) 推荐(0) 编辑
  2020年8月17日
摘要: ##一、ORB-SLAM的主要贡献 ##二、ORB-SLAM的系统架构 ##三、ORB-SLAM流程 ORB-SLAM 它是由三大块、三个流程同时运行的。第一块是跟踪,第二块是建图,第三块是闭环检测。 ###Part 0 自动地图初始化 参考自 https://blog.csdn.net/u0101 阅读全文
posted @ 2020-08-17 17:50 Justing778 阅读(838) 评论(0) 推荐(0) 编辑
  2020年8月15日
摘要: ##Part Ⅰ 代码练习 ###1 HybridSN 高光谱分类网络。 三维卷积部分: conv1:(1, 30, 25, 25), 8个 7x3x3 的卷积核 ==>(8, 24, 23, 23) conv2:(8, 24, 23, 23), 16个 5x3x3 的卷积核 ==>(16, 20, 阅读全文
posted @ 2020-08-15 20:03 Justing778 阅读(611) 评论(0) 推荐(0) 编辑
  2020年8月10日
摘要: ##Ch07 视觉里程计Ⅰ ###1 特征点 特征点由两部分组成:关键点和描述子。 关键点:在图像中的位置 描述子:描述该关键点周围像素的信息,是一个空间向量;只要两个特征点的描述子在向量空间上的距离相近,就可以认为他们是同样的特征点。 ###2 ORB特征 ###2.1 组成 关键点:Orient 阅读全文
posted @ 2020-08-10 19:02 Justing778 阅读(282) 评论(0) 推荐(0) 编辑