前景监测

可以简短地将问题概括如下：

对静态背景进行前景提取
对动态视频进行前景提取
对晃动视频进行前景提取
对多视角的视频进行有效的前景提取
前景提取的作用（群体性事件的预警？）

对静态背景进行前景提取

对于静态的背景，我们可以采用高斯混合模型（以下推理部分主要来自[1]）利用视频每一帧的信息拟合出一个背景，然后利用背景差分的办法提取出前景目标。记每一帧的图像中某一个点的像素值为序列

由于固定场景中，图中像素点相对稳定，假设每个像素点均服从正态分布，一般地，我们可以用

由于某个像素点的灰度值用随机变量

f (X t = x) = \sum i = 1 k ω i, t η (x, μ i

其中

η (x, μ i, t, Σ i, t) = 1 ( 2 π )

上式中

μ 0 = 1 N \sum t = 0 N X t , σ 2 0 = 1 N \sum

上式中

χ (X i, t) = {1, ∣∣ X i, t - μ i, t ∣∣

μ i, t = (1 - ρ) μ i, t - 1 + ρ X i, t,

其中

考虑一个视频图像，由于我们考察的背景是相对静止的。所以，对于每一个背景点，其方差是比较小的，根据上述更新公式可以知道，用于描述背景点的高斯分布的权重不断增大，考虑这两个特点，我们可以建立如下前景提取办法，首先对权重进行归一化处理：

ω i, t, k = ω i , t \sum i = 1 k ω i , t ,

接下来，根据

s = arg min k {\sum i = 1 k ω i, t > T},

其中

我们利用本节模型对pedestrian视频进行处理，得到如下结果：
这里写图片描述

结果一般，差强人意。上图分别为视频在第18帧到第21帧的分离结果，其中图(a)是分离结果，图(b)是视频原图。可以看出距离摄像机较近的部分分离效果良好，较远的目标分离效果欠佳，总体而言可以较好地提取前景目标。

对动态视频进行前景提取

对于动态背景的视频，我们不妨假设背景的变化幅度是较小的。这样我们可以把它看作是一个微小的扰动（黔驴技穷），我们可以利用图像的形态学处理和中值滤波对背景进行处理，结合本节的高斯混合模型对waterSurface视频处理可以得到如下结果：
这里写图片描述

上图中(a)为直接用本节的高斯混合模型得到的分离结果，图(b)为进行形态学处理和中值滤波之后的结果，可以看出图(b)的结果基本消除了背景的动态扰动，具有较好的结果。

晃动视频的前景目标提取

我们不妨假设晃动的幅度不大，此时我们可以将这样的幅度变换近似地看成是仿射变换。如下图所示：
这里写图片描述
将视角统一后，我们便可以把晃动视频的情况转换为固定视角的视频，由此可以由上一节的高斯混合模型得出前景分离结果。下面我们将以目标视频的第一帧作为基准，将其他帧的视频全部矫正为第一帧的视角，注意到的是我们考虑的视频必须是短时间的，这样能保证，其他帧到第一帧的仿射变换总是存在的(更进一步地，实际上只要保证对应的像素点至少有两对即可)。

我们设基准图像上的像素为

⎛⎝⎜ x' y' 1 ⎞⎠⎟ = ⎛⎝⎜ a 11 a 21

利用对视角变化等仿射变换具有强大稳定性的SIFT算法我们可以获得足够多的特征点，下面我们利用获得的足够多的特征点来拟合求解出仿射变换对应的变换矩阵。以变换矩阵的第一行为例，我们有

a 11 x (j) + a 12 y (j) + b (j) 1 = x' (j), j =

上式可以简写为

这里写图片描述

令

\nabla a E = 2 (X T X a - X T c) = 0 \Rightarrow a = (

分析可知，当

这里写图片描述

获得上图后不能马上用高斯混合模型进行处理，这是因为可以看到校正后的视频(图(b))有大量的黑边，如果直接套用高斯混合模型，将会把黑边的变化造成的噪声也识别出来。我们必须找到一个合适的视角区域，由于我们可以认为处理的视频是一个较短的视频，基于这个假设，我们可以取所有校正后的视频的公共重叠部分。可以知道，由假设，这个公共重叠部分是足够大的。

这里写图片描述