光流是空间运动物体在观测成像平面上的像素运动的“瞬时速度”。具体来说,当给定两帧图像时,光流估计旨在找出上一帧图像中的每一个点在下一帧图像中的位置变化,即这些点移动到了什么位置。这个过程可以用来对图像进行动态分析,如目标跟踪等。
光流估计的基本思想是,如果两帧图像中的某个像素点的强度发生了变化,那么这个像素点可能是由于物体的运动引起的。因此,光流估计的目标是找到每个像素点的位移矢量,以表示其运动方向和速度。
为了实现这一目标,需要基于一些假设,如亮度恒定(同一点随着时间的变化,其亮度不会发生改变)、小运动(随着时间的变化不会引起位置的剧烈变化)和空间一致(一个场景上邻近的点投影到图像上也是邻近点,且邻近点速度一致)等。这些假设有助于构建光流估计的数学模型,并通过求解该模型来得到光流场。
(1)亮度恒定:同一点随着时间的变化,其亮度不会发生改变。
(2)小运动:随着时间的变化不会引起位置的剧烈变化,只有小运动情况下才能用前后帧之间单位位置变化引起的灰度变化去近似灰度对位置的偏导数。
(3)空间一致:一个场景上邻近的点投影到图像上也是邻近点,且邻近点速度一致。因为光流法基本方程约束只有一个,而要求x,y方向的速度,有两个未知变量。所以需要连立n多个方程求解。
OpenCV提供了多种光流估计算法,其中常见的有Lucas-Kanade法和Farneback法。
Lucas-Kanade法:
Farneback法:
在进行光流估计时,需要设置一些参数来控制算法的性能。这些参数包括最大/最小光流值、阈值、窗口大小和迭代次数等。
以下是运用Lucas-Kanade法进行光流估计的代码,我们对其进行逐一讲解,并为其注释,以便大家更好的理解代码。
import numpy as np
import cv2
# 创建了一个 VideoCapture 对象,用于从视频文件 'test.avi' 中读取帧。
cap = cv2.VideoCapture('test.avi')
# 生成一个 100x3 的数组,包含随机整数,范围从 0 到 255。这些整数代表 RGB 颜色值,用于绘制轨迹
color = np.random.randint(0, 255, (100, 3))
# 读取视频的第一帧,ret 是一个布尔值,表示是否成功读取。
ret, old_frame = cap.read()
# 将第一帧从 BGR 转换为灰度图像,因为光流算法通常在灰度图像上运行
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)
# 定义特征点检测参数
feature_params = dict(maxCorners=100, # 最大角点数量
qualityLevel=0.3, # 角点质量的阚值
minDistance=7) # 最小距离,用于分散角点
# 在第一帧的灰度图像上检测特征点
p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params) # **:关键字参数解包,用于将字典解包为关键字参数,
# 创建一个与当前帧大小相同的全零掩模,用于绘制轨迹
mask = np.zeros_like(old_frame)
# 定义Lucas-Kanade光流参数
lk_params = dict(winSize=(15, 15), # 窗口大小
maxLevel=2) # 金字塔层数
# 主循环,处理视频的每一帧
while (True):
# 读取下一帧
ret, frame = cap.read()
# 检查是否成功读取到帧
if not ret:
break
frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 使用 Lucas-Kanade 方法计算从上一帧到当前帧的光流。
p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params)
# 筛选有效特征点,st 是一个状态数组,st == 1 表示成功找到对应点的特征点。
good_new = p1[st == 1]
good_old = p0[st == 1]
# 绘制轨迹
for i, (new, old) in enumerate(zip(good_new, good_old)):
a, b = new.ravel()
c, d = old.ravel()
a, b, c, d = int(a), int(b), int(c), int(d)
# 在掩膜上绘制线段,连接新点和旧点
mask = cv2.line(mask, (a, b), (c, d), color[i].tolist(), 2)
cv2.imshow('mask', mask)
# 将掩膜添加到当前帧
img = cv2.add(frame, mask)
cv2.imshow('frame', img)
# 等待150毫秒,检测是否按下ESC键
k = cv2.waitKey(150) & 0xff
if k == 27:
break
# 更新旧灰度图和就特征点
old_gray = frame_gray.copy()
p0 = good_new.reshape(-1, 1, 2) # 重新整理特征点
cv2.destroyAllWindows()
cap.release()
这段代码实现了使用 Lucas-Kanade 光流算法来跟踪视频中的特征点,并绘制它们的运动轨迹。通过逐帧读取视频,计算光流,并更新特征点的位置,代码能够实时显示特征点的运动轨迹。
综上所述,OpenCV中的光流估计是一项强大的技术,可以用于实现各种计算机视觉任务。通过合理选择算法和参数,并结合其他技术进行优化和改进,可以实现对运动物体的精确跟踪和定位。