MIL 多示例学习特征选择

　　一个主要的跟踪系统包含三个成分：1）外观模型，通过其可以估计目标的似然函数。2）运动模型，预测位置。3）搜索策略，寻找当前帧最有可能为目标的位置。MIL主要的贡献在第一条上。

　　MIL与CT的不同在于后者是通过感知矩阵进行特征提取，而MIL是通过boosting框架来进行特征选择，选择出来的特征（高斯分布）作为分类器用于对采样图像块的筛选，响应最大采样帧即估计目标。

　　多示例学习考虑的问题就是类别里含有大量难以去除的噪声，其将样本看成包（bag）的形式，一个bag中包含若干示例（即一个样本及其标签flag），某个示例的flag不定性较大，即其可能为正或负示例，但对于一个包含n个示例的bag，只要知道任意一个示例的flag为正就将其标志为正bag，而bag要为负，其中所有的示例都为负才行。由原文中表达式可看出，y_i=max_j(y_ij)，y=1，0分别表示正负样本，MIL有了其特有的外观模型。论文[1]中的Noisy-OR模型描述了p(y|X)与p(y|x)的关系：

p(y_i|X_i)=1-prod(1-p(y_i|x_ij))

而p(y_i|x_ij)=sigmoid(H(x))，H表示强分类器，H=sum_K(a*h)，K为特征数即我们要训练后选出的有效特征数。这里h是弱分类器，其表达式为

h_k=log[p(y=1|f(k)/p(y=0|f(k)]

即p(具有某一特征的采样属于正样本)/p(具有某一特征的采样属于负样本)，该值越大，采样越可能为正样本。由于正负样本已知，这里假设其特征符合高斯分布。

　　于是，可通过求似然函数L=sum(logp(p(y_i|X_i)))来进行特征的选择：首先求出L最大时的h_i，并记录下所选特征的位置(即该特征可很好的区分当前帧正负样本，从而使得采样较易标签)，依次类推，文中迭代了50次，即每个样本的特征向量长度为50，减少了弱分类类性质的特征的同时也减小了运算，最终，提取出较强的特征。

PS：本文的图像块的特征是harr特征，随机选取2到4个矩阵进行计算获得一个特征值（可通过积分图进行快速计算），程序中获取了长度为250的特征向量，有效地减少特征向量长度可提升算法的性能。

　　主要步骤理解为：1 获得正负样本的harr特征 2 通过MIL和boosting(提升)算法，训练正负样本，计算出使似然函数L最大的强特征 3 有了分类器，在当前帧目标附近采样大量图像块并计算出相应的特征(这里由于正负样本训练完成，强特征位置已知) 4 计算出采样样本在分类器器上的响应，响应最大的即为估计目标块。

　　而CT：1 获取正负样本的所有harr特征(高维，10的6次方) 2 感知矩阵R提取特征 3 训练贝叶斯分类器，获得参数 4 采样，计算分类器响应，响应最大的即为目标块

比较MIL与CT：1 初始特征维度不一样 2 CT降维的同时较好的保留了原高维向量信息；MIL选取了分类性能较强的特征作为训练器输入 4 CT 贝叶斯分类器；MIL boosting提升了贝叶斯分类器的性能 4 MIL采用了自适应表观模型(在线多示例学习)，对噪声有较好的鲁棒性 5 由于都含有贝叶斯分类的思想，都属于判决式跟踪范畴。

[1] Multiple Instance Boosting for Object Detection. Paul Viola.

Visual tracking with online Multiple Instance Learning.

posted @ 2014-10-20 22:41 rose_琨阅读(921) 评论(0) 编辑收藏举报

刷新页面返回顶部

rose_琨

"Make everything as simple as possible, but not simpler."-by Albert Einstein

MIL 多示例学习特征选择

公告

rose_琨

"Make everything as simple as possible, but not simpler."-by Albert Einstein

MIL 多示例学习 特征选择

公告

MIL 多示例学习特征选择