摘要: Python相关知识索引 阅读全文
posted @ 2018-06-02 23:20 叠加态的猫 阅读(1371) 评论(0) 推荐(1) 编辑
摘要: A Tree-Structured Decoder for Image-to-Markup Generation(https://www.zhuanzhi.ai/document/f09d28ca52b77a13a13bf44a86aba64d)Handwritten Mathematical Ex 阅读全文
posted @ 2022-07-17 22:18 叠加态的猫 阅读(231) 评论(0) 推荐(0) 编辑
摘要: https://arxiv.org/pdf/1910.02562.pdf 总体介绍 基于Seq2Seq的OCR改进文章,提出两个问题,encoder特征间相似度太高导致注意力不准 & RNN-based的结构需要逐个step跑效率太低: 1、 such methods suffer from att 阅读全文
posted @ 2022-05-16 00:20 叠加态的猫 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 和用LSTM的方法对比, 和transform相比主要区别在于编码器上,由3部分构成: 1、Shallow CNN,用于控制计算量 2、Adaptive 2D positional encoding 论文中说Transformer的Position Encoding模块可能在视觉作用中起不了作用,但 阅读全文
posted @ 2022-05-06 10:13 叠加态的猫 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 简单介绍下问题背景以及算法迭代流程,涉及一点推导 阅读全文
posted @ 2021-10-26 22:08 叠加态的猫 阅读(3607) 评论(0) 推荐(0) 编辑
摘要: 三元组添加margin(记为alpha)形式损失函数为: 将特征归一化,并带入xc=(xp+xa)/2,省略常数项得到: 考虑log(exp(y1) + exp(y2)) ≥ max(y1, y2),对batch数据的处理整理为: Batch整合的推导没深究,看起来是取了对单个anchor而言bat 阅读全文
posted @ 2021-10-24 12:50 叠加态的猫 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 2. Pre-processing Tricks 2.1. Dataset Cleaning for Training TR1 We noticed by visual inspection that the training set of GLD v1 is clean and reliable, 阅读全文
posted @ 2021-10-23 16:20 叠加态的猫 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 简单理下代码逻辑,记录下对本文涉及到的最优化传输部分的理解。 阅读全文
posted @ 2021-09-12 21:25 叠加态的猫 阅读(1475) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/361366090 目前transform的两个非常严峻的问题 受限于图像的矩阵性质,一个能表达信息的图片往往至少需要几百个像素点,而建模这种几百个长序列的数据恰恰是Transformer的天生缺陷; 目前的基于Transformer框架更多 阅读全文
posted @ 2021-07-25 20:52 叠加态的猫 阅读(783) 评论(0) 推荐(0) 编辑
摘要: 感受野尺寸、中心计算涉及文献: 有效感受野文献: 阅读全文
posted @ 2021-07-21 23:16 叠加态的猫 阅读(48) 评论(0) 推荐(0) 编辑
摘要: https://docs.python.org/3/library/multiprocessing.html?highlight=imap_unordered#multiprocessing.pool.Pool.imap_unordered 注意,worker函数不能写在其他函数内部: def fu 阅读全文
posted @ 2021-06-04 17:17 叠加态的猫 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 原文地址: https://developer.nvidia.com/zh-cn/blog/building-cuda-applications-cmake/ https://developer.nvidia.com/blog/building-cuda-applications-cmake/ 一个 阅读全文
posted @ 2021-06-01 23:03 叠加态的猫 阅读(695) 评论(0) 推荐(0) 编辑
摘要: 对上采样的优化:动态的选取新像素对哪些原有像素存在依赖 Large field of view. Unlike previous works (e.g. bilinear interpolation) that only exploit subpixel neighborhood, CARAFE c 阅读全文
posted @ 2021-05-30 17:36 叠加态的猫 阅读(536) 评论(0) 推荐(0) 编辑
摘要: “ 我认为MoCo这篇最创新的地方,就是解决了一个非常重要但以前又没有思路的工程问题,就是怎么节省内存节省时间搞到大量的negative sample。之前的memory bank虽然机智,但是必须存下来整个数据集,空间开销O(N),所以处理不了Instagram级别的数据,这个问题困扰我很久而且我 阅读全文
posted @ 2021-05-16 21:00 叠加态的猫 阅读(1281) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/144059763 Yolo V3 上图三个蓝色方框内表示Yolov3的三个基本组件: CBL:Yolov3网络结构中的最小组件,由Conv+Bn+Leaky_relu激活函数三者组成。 Res unit:借鉴Resnet网络中的残差结构,让 阅读全文
posted @ 2021-03-28 20:10 叠加态的猫 阅读(561) 评论(0) 推荐(0) 编辑
摘要: 电脑中包含多版本OpenCV、项目找不到默认的OpenCV等问题 阅读全文
posted @ 2021-01-05 14:23 叠加态的猫 阅读(2564) 评论(0) 推荐(0) 编辑