01 2017 档案
摘要:目标检测问题,R-FCN是在Faster R-CNN的框架上进行改造,第一,把base的VGG16换车了ResNet,第二,把Fast R-CNN换成了先用卷积做prediction,再进行ROI pooling。由于ROI pooling会丢失位置信息,故在pooling前加入位置信息,即指定不同score map是负责检测目标的不同位置。pooling后把不同位置得到的score map进行组合就能复现原来的位置信息。
阅读全文
摘要:文本线检测,先用一个coarse-CNN检测粗略的文字区域(文字块),再用fine-CNN提取文字区域中的文本线。CNN是VGG16上进行三点修改,滤波器改为矩形,引入全卷积代替全连接,用多层feature map进行融合
阅读全文
摘要:文本检测,先用CNN得到深度特征,然后用固定宽度的anchor来检测text proposal(文本线的一部分),并把同一行anchor对应的特征串成序列,输入到RNN中,最后用全连接层来分类或回归,并将正确的text proposal进行合并成文本线。
阅读全文
摘要:介绍了一个针对小目标的benchmark库,并对传统的R-CNN进行修改(对RPN进行修改,利用了proposal的上下文),用来检测小目标。
阅读全文

浙公网安备 33010602011771号