目标跟踪简介

1.视觉目标跟踪基本流程与框架


目标跟踪的任务就是在给定某视频序列初始帧的目标大小与位置的情况下,预测后续帧中该目标的大小与位置。

这一基本任务流程可以按如下的框架划分:

目标跟踪简介_第1张图片

大致流程:先输入初始化目标框(初始帧),在下一帧中产生众多候选框(Motion Model),提取这些候选框的特征(Feature Extractor),然后对这些候选框进行评分(Observation Model),最后在这些所有的评分当中选取出评分最高的候选框作为预测的目标,或者把多个预测值进行融合(Ensemble)得到更优的预测目标。

目标跟踪划分为5项目主要的研究内容:(1)运动模型:如何产生众多的候选样本(2)特征提取:利用何种特征表示目标。(3)观测模型:如何为众多候选样本进行评分。(4)模型更新:如何更新观测模型使其适应目标的变化。(5)集成方法:如何融合多个决策获得一个更优的决策结果。

运动模型(Motion Model):生成候选样本的速度与质量直接决定了跟踪系统表现的优劣。常用的有两种方法:粒子滤波滑动窗口。粒子滤波是一种序贯贝叶斯推断方法,通过递推的方式推断目标的隐含状态。而滑动窗口是一种穷举搜索方法,它列出目标附近的所有可能的样本作为候选样本。

特征提取(Feature Extractor):鉴别性的特征表示是目标跟踪的关键之一。常用的特征被分为两种类型:手工设计的特征(Hand-crafted feature)和深度特征(Deep feature)。常用的手工设计的特征有灰度特征,方向梯度直方图,哈尔特征,尺度不变特征等。与人为设计的特征不同,深度特征是通过大量的训练样本学习出来的特征,它比手工设计的特征更加具有鉴别性。

观测模型(Observation Model):观测模型可分为两类:生成式模型和判别式模型,生成式模型通常寻找与目标模板最相似的候选作为跟踪结果(模板匹配)常用的理论方法包括:子空间,稀疏表示,字典学习等。而判别式模型通过训练一个分类器去区分目标与背景,选择置信度最高的候选样本作为预测结果。判别式方法已经成为目标跟踪中的主流方法,因为有大量的机器学习方法可以利用。常用的理论方法包括:逻辑回归,岭回归支持向量机,多示例学习,相关滤波等。

模型更新(Model Update):模型更新主要是更新观测模型,以适应目标表现的变化,防止跟踪过程中发生漂移。

集成方法(Ensemble Method):集成方法有利于提高模型的预测精度,也常常被视为一种提高跟踪准确率的有效手段。可以把集成方法分为两类:在多个预测结果中选择一个最好的,或是利用所有的预测加权平均。

2.视觉目标跟踪面临的挑战


1.遮挡

2.形变

3.背景杂斑

4.尺度变换

5.运动模糊

6.光照

7.旋转

8.快速运动

9.超出视野

10.低分辨率

3.视觉目标跟踪方法

1.稀疏表示:给定一组过完备字典,将输入信号用这组过完备字典线性表示,对线性表示的系数做一个稀疏性的约束(即使得系数向量的分量尽可能多的为0),那么这一过程就称为稀疏表示。

2.相关滤波:基于相关滤波的跟踪方法的基本思想就是,寻找一个滤波模版,让下一帧的图像与我们的滤波模板做卷积操作,响应最大的区域则是预测的目标。

3.深度学习:因为深度特征对目标拥有强大的表示能力。

你可能感兴趣的:(目标跟踪简介)