摘要: 最近重新看了Faster R-CNN系列论文,对其中边框回归的目标和损失函数的设计思路有了新的认识,这里记录一下。 对于边框回归问题,假设我们已经得到了预测框$(P_,P_,P_,P_)\(,即一个预测框中心点坐标和它的长宽,在Faster R-CNN中,有两个东西可以看成是预测框,第一个是RPN中 阅读全文
posted @ 2020-06-04 11:03 WuShufan 阅读(804) 评论(0) 推荐(0)
摘要: 在实现 "TextMountain" 时,生成TCBP时需要计算文本区域点到四条边的距离,由于计算量大,所以最好是使用矩阵运算,提高运行效率。 基础讲解: 由于需要使用到矩阵运算,最好采用向量的方法来进行表示。 为了讲述方便,我们设直线为x轴,用向量oq表示,对于点p,要计算p到直线oq的距离,我们 阅读全文
posted @ 2020-04-02 21:10 WuShufan 阅读(6301) 评论(0) 推荐(0)
摘要: opencv python保存视频 最近在编程过程中遇到了保存视频的问题,之前使用 的方式保存的mp4文件在chrome中无法播放,查阅相关资料后发现是由于chrome由于版权问题只支持h264编码的视频。所以使用 工具来对保存好的视频转码,代码如下 我们首先定义使用XVID的编码格式对视频帧进行编 阅读全文
posted @ 2020-02-07 19:36 WuShufan 阅读(6757) 评论(0) 推荐(0)