01 2017 档案

摘要:目标检测问题,R-FCN是在Faster R-CNN的框架上进行改造,第一,把base的VGG16换车了ResNet,第二,把Fast R-CNN换成了先用卷积做prediction,再进行ROI pooling。由于ROI pooling会丢失位置信息,故在pooling前加入位置信息,即指定不同score map是负责检测目标的不同位置。pooling后把不同位置得到的score map进行组合就能复现原来的位置信息。 阅读全文
posted @ 2017-01-13 14:44 lilicao 阅读(32761) 评论(1) 推荐(3)
摘要:文本线检测,先用一个coarse-CNN检测粗略的文字区域(文字块),再用fine-CNN提取文字区域中的文本线。CNN是VGG16上进行三点修改,滤波器改为矩形,引入全卷积代替全连接,用多层feature map进行融合 阅读全文
posted @ 2017-01-12 23:06 lilicao 阅读(2801) 评论(0) 推荐(0)
摘要:文本检测,先用CNN得到深度特征,然后用固定宽度的anchor来检测text proposal(文本线的一部分),并把同一行anchor对应的特征串成序列,输入到RNN中,最后用全连接层来分类或回归,并将正确的text proposal进行合并成文本线。 阅读全文
posted @ 2017-01-12 21:49 lilicao 阅读(20936) 评论(4) 推荐(0)
摘要:介绍了一个针对小目标的benchmark库,并对传统的R-CNN进行修改(对RPN进行修改,利用了proposal的上下文),用来检测小目标。 阅读全文
posted @ 2017-01-06 18:13 lilicao 阅读(2018) 评论(1) 推荐(1)