摘要: TCNN 静态图像中目标检测(rcnn,fast rcnn, faster rcnn, yolo, ssd 等) 上下文信息 使用图像检测算法将视频帧当做独立的图像来处理并没有充分利用整个视频的上下文信息。虽然说视频中可能出现任意类别的目标,但对于单个视频片段,只会出现比较少的几个类别,而且这几个类 阅读全文
posted @ 2017-11-14 22:30 hahahaf 阅读(6160) 评论(0) 推荐(0) 编辑
摘要: AlexNet-> vgg vgg 采用更小的卷积核,加深网络深度,但两者的共同点都是卷积层+pooling层最后接上fc 层的结构 Network in network ->googleNet NIN 中采用global average pooling ,而不是使用 fc 层,减少了网络参数,go 阅读全文
posted @ 2017-11-14 14:54 hahahaf 阅读(827) 评论(0) 推荐(0) 编辑