图像零交叉点,视频生成,视频识别,视频摘要,视频浓缩
图像零交叉点,视频生成,视频识别,视频摘要,视频浓缩
一.视频生成,视频识别,视频摘要,视频浓缩
视频生成与视频识别
视频分析的两大任务,前者侧重于对下一帧的预测,而前者则侧重于视频内容的理解。由于视频是由一系列的视频帧组成的,那么如果有大量的视频数据,通过分析视频中动态场景的变化情况,就可以合成出一些小的动态场景视频。
(1)从海量的未标记视频数据获取动态场景的先验信息;
(2)提出一种视频的生成模型。
视频生成的原理框架如下图所示:
由于视频通常由静态的背景和动态的前景构成。论文根据这一常识设计了双路的生成模型分别用来生成静态背景 Background 和前景动态Foreground。其合成方式见foregroud, mask 和background的公式。其合成过程的可视化如下图所示:
由于视频通常由静态的背景和动态的前景构成。论文根据这一常识设计了双路的生成模型分别用来生成静态背景 Background 和前景动态Foreground。其合成方式见foregroud, mask 和background的公式。其合成过程的可视化如下图所示:
视频摘要和视频浓缩
发现很多人连视频摘要和浓缩的区别都不知道,就开始误导群众。这里只想从技术实现角度简单谈谈什么叫做视频摘要和视频浓缩。
视频摘要,其实是静态视频摘要的简称,也就是我们常听到的摘要技术。它仅仅是对视频关键帧的提取,然后再组合成新视频。好比一部电影的预告片一样!
视频浓缩,其实是动态的视频摘要。其技术实现涉及到相当复杂的算法。
一般包括四个步骤:
1.运动目标检测,这里涉及到背景建模,场景分割,运动目标提取等算法;
2.目标轨迹提取,轨迹提取算法涉及到目标跟踪算法,如camshift、TLD等;
3.轨迹组合优化,主要是通过组合算法得到轨迹时间序列;
4.生成浓缩视频,将目标轨迹集合与背景图像拼接成帧,再将帧组合成视频。
二.图像处理的零交叉点原理和示例
二阶导数在灰度斜坡和灰度台阶过渡处会产生双边缘响应。
二阶导数的符号可以用于确定边缘的过渡是从亮到暗还是暗到亮。
斜坡开始处,二阶导数为负,斜坡结束二阶导数为正,斜坡上,二阶导数为0.(亮到暗边缘)
零交叉点的定义:零灰度轴和二阶导数极值的连线的交点称为该二阶导数的零交叉点。
一条边缘的两个附加性质:
(1)对图像中的每条边缘,二阶导数生成两个值
(2)二阶导数的零交叉点可用于定位粗边缘的中心
总结:
二阶导数提取边缘往往产生双边缘。通过求零交叉点可以确定边缘的中心,从而避免了产生双边缘的不方便。