lucifer_zhy

Opencv3中SURF算法学习

流程图：

哈尔特征harr

积分图

AdaBoost级联分类器

SURF原理

（1）构建Hessian矩阵构造高斯金字塔尺度空间

黑塞矩阵

图像金字塔

高斯金字塔

DOG金字塔

尺度空间

（2）利用非极大值抑制初步确定特征点

非极大值抑制

（3）精确定位极值点

三维线性插值法

（4）选取特征点的主方向

（5）构造surf特征点描述算子

（6）特征点匹配

代码实现：

效果图：

补充：

卷积的理解：

原论文的下载链接：

部分推导过程：

Sift实现代码

流程图：

下载链接：对surf算法的整体的一个流程的描绘；_opencv3surf-机器学习文档类资源-CSDN下载

SURF算法：SURF（加速版的具有鲁棒性的特征），SURF是尺度不变特征变换算法（SIFT算法）的加速版。SURF最大的特征在于采用了harr特征以及积分图像的概念。

哈尔特征harr

Haar(哈尔)特征分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如：脸部的一些特征能由矩形特征简单的描述，如：眼睛要比脸颊颜色要深，鼻梁两侧比鼻梁颜色要深，嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构，如边缘、线段较敏感，所以只能描述特定走向（水平、垂直、对角）的结构。

对于图中的A, B和D这类特征，特征数值计算公式为：v=Σ白-Σ黑，而对于C来说，计算公式如下：v=Σ白-2*Σ黑；之所以将黑色区域像素和乘以2，是为了使两种矩形区域中像素数目一致。我们希望当把矩形放到人脸区域计算出来的特征值和放到非人脸区域计算出来的特征值差别越大越好，这样就可以用来区分人脸和非人脸。

通过改变特征模板的大小和位置，可在图像子窗口中穷举出大量的特征。上图的特征模板称为“特征原型”；特征原型在图像子窗口中扩展（平移伸缩）得到的特征称为“矩形特征”；矩形特征的值称为“特征值”。

常用的矩形特征有三种：两矩形特征、三矩形特征、四矩形特征，如图：

由图表可以看出，两矩形特征反映的是边缘特征，三矩形特征反映的是线性特征、四矩形特征反映的是特定方向特征。

上图中两个矩形特征，表示出人脸的某些特征。比如中间一幅表示眼睛区域的颜色比脸颊区域的颜色深，右边一幅表示鼻梁两侧比鼻梁的颜色要深。同样，其他目标，如眼睛等，也可以用一些矩形特征来表示。使用特征比单纯地使用像素点具有很大的优越性，并且速度更快。

子窗口中的特征个数即为特征矩形的个数。训练时，将每一个特征在训练图像子窗口中进行滑动计算，获取各个位置的各类矩形特征。在子窗口中位于不同位置的同一类型矩形特征，属于不同的特征。可以证明，在确定了特征的形式之后，矩形特征的数量只与子窗口的大小有关。在24×24的检测窗口中，矩形特征的数量约为160,000个。特征模板可以在子窗口内以“任意”尺寸“任意”放置，每一种形态称为一个特征。找出子窗口所有特征，是进行弱分类训练的基础。

子窗口内的条件矩形，矩形特征个数的计算：

如图所示的一个m*m大小的子窗口，可以计算在这么大的子窗口内存在多少个矩形特征。

以 m×m 像素分辨率的检测器为例，其内部存在的满足特定条件的所有矩形的总数可以这样计算：
对于 m×m 子窗口，我们只需要确定了矩形左上顶点A(x1,y1)和右下顶点B(x2,63) ，即可以确定一个矩形；如果这个矩形还必须满足下面两个条件（称为(s, t)条件，满足(s, t)条件的矩形称为条件矩形）：

1) x 方向边长必须能被自然数s 整除（能均等分成s 段）；
2) y 方向边长必须能被自然数t 整除（能均等分成t 段）；
于是这个矩形的最小尺寸为s×t 或t×s，最大尺寸为[m/s]·s×[m/t]·t 或[m/t]·t×[m/s]·s；其中[ ]为取整运算符。//此处没有太懂，有懂兄台的希望可以留言告诉我下是什么意思；个人理解的s是分出来的最小矩形的其一边长为s，而不是分为s段；

由上分析可知，在m×m 子窗口中，满足(s, t)条件的所有矩形的数量为：

实际上，(s, t)条件描述了矩形特征的特征，下面列出了不同矩形特征对应的(s, t)条件：

下面以 24×24 子窗口为例，具体计算其特征总数量：

下面列出了，在不同子窗口大小内，特征的总数量：

矩形特征可位于图像任意位置，大小也可以任意改变，所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化，使得很小的检测窗口含有非常多的矩形特征，如：在24*24像素大小的检测窗口内矩形特征数量可以达到16万个。这样就有两个问题需要解决了：

（1）如何快速计算那么多的特征？---积分图大显神通；

（2）哪些矩形特征才是对分类器分类最有效的？---如通过AdaBoost算法来训练。

积分图

积分图就是只遍历一次图像就可以求出图像中所有区域像素和的快速算法，大大的提高了图像特征值计算的效率。

积分图主要的思想是将图像从起点开始到各个点所形成的矩形区域像素之和作为一个数组的元素保存在内存中，当要计算某个区域的像素和时可以直接索引数组的元素，不用重新计算这个区域的像素和，从而加快了计算（这有个相应的称呼，叫做动态规划算法）。积分图能够在多种尺度下，使用相同的时间（常数时间）来计算不同的特征，因此大大提高了检测速度。

积分图是一种能够描述全局信息的矩阵表示方法。积分图的构造方式是，位置(A)处的值是原图像在位置(A)左上角方向所有像素的和；

而Haar-like特征值无非就是两个矩阵像素和的差，同样可以在常数时间内完成。

一个区域的像素值的和，可以由该区域的端点的积分图来计算。由前面特征模板的特征值的定义可以推出，矩形特征的特征值可以由特征端点的积分图计算出来。以A矩形特征为例，如下图，使用积分图计算其特征值：

该矩形特征的特征值，由定义，为区域A的像素值减去区域B的像素值。

区域A的像素值：ii(5)+ii(1)-ii(2)-ii(4) ········(a)

区域B的像素值：ii(6)+ii(2)-ii(5)-ii(3) ········(b)

所以：该矩形特征的特征值(a)-(b);

所以，矩形特征的特征值，只与特征矩形的端点的积分图有关，而与图像的坐标无关。通过计算特征矩形的端点的积分图，再进行简单的加减运算，就可以得到特征值，正因为如此，特征的计算速度大大提高，也提高了目标的检测速度。

AdaBoost级联分类器

级联分类模型是树状结构可以用下图表示：

其中每一个stage都代表一级强分类器。当检测窗口通过所有的强分类器时才被认为是正样本，否则拒绝。实际上，不仅强分类器是树状结构，强分类器中的每一个弱分类器也是树状结构。由于每一个强分类器对负样本的判别准确度非常高，所以一旦发现检测到的目标位负样本，就不在继续调用下面的强分类器，减少了很多的检测时间。因为一幅图像中待检测的区域很多都是负样本，这样由级联分类器在分类器的初期就抛弃了很多负样本的复杂检测，所以级联分类器的速度是非常快的；只有正样本才会送到下一个强分类器进行再次检验，这样就保证了最后输出的正样本的伪正(false positive)的可能性非常低。

级联分类器是如何训练的呢？首先需要训练出每一个弱分类器，然后把每个弱分类器按照一定的组合策略，得到一个强分类器，我们训练出多个强分类器，然后按照级联的方式把它们组合在一块，就会得到我们最终想要的Haar分类器。

一个弱分类器就是一个基本和上图类似的决策树，最基本的弱分类器只包含一个Haar-like特征，也就是它的决策树只有一层，被称为树桩（stump）。

以20*20图像为例，78,460个特征，如果直接利用AdaBoost训练，那么工作量是极其极其巨大的。

所以必须有个筛选的过程，筛选出T个优秀的特征值（即最优弱分类器），然后把这个T个最优弱分类器传给AdaBoost进行训练。

弱分类器训练：

1、对于每个特征，计算所有训练样本的特征值，并将其排序：

2、扫描一遍排好序的特征值，对排好序的表中的每个元素，计算下面四个值：

计算全部正例的权重和；

计算全部负例的权重和；

计算该元素前之前的正例的权重和；

计算该元素前之前的负例的权重和；

3、选取当前元素的特征值 $F_{kj}$ 和它前面的一个特征值Fk,j−1之间的数作为阈值，所得到的弱分类器就在当前元素处把样本分开 —— 也就是说这个阈值对应的弱分类器将当前元素前的所有元素分为人脸（或非人脸），而把当前元素后（含）的所有元素分为非人脸（或人脸）。该阈值的分类误差为：

于是，通过把这个排序表从头到尾扫描一遍就可以为弱分类器选择使分类误差最小的阈值（最优阈值），也就是选取了一个最佳弱分类器。

强分类器训练：

注意，这里所说的T=200个弱分类器，指的是非级联的强分类器。若果是用级联的强分类器，则每个强分类器的弱分类器的个数会相对较少。

一般学术界所说的级联分类器，都是指的是级联强分类器，一般情况有10个左右的强分类器，每个强分类有10-20个弱分类器。当然每一层的强分类器中弱分类器的个数可以不相等，可以根据需要在前面的层少放一些弱分类器，后面的层次逐渐的增加弱分类器的个数。

SURF原理

（1）构建Hessian矩阵构造高斯金字塔尺度空间

黑塞矩阵

黑塞矩阵（Hessian Matrix）是一个多元函数的二阶偏导数构成的方阵；

SIFT采用的是DoG图像，而SURF采用的是Hessian矩阵（SURF算法核心）行列式近似值图像。在数学中，Hessian矩阵是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵，即每一个像素点都可以求出一个2x2的Hessian矩阵，可计算出其行列式detH，可以利用行列式取值正负来判别该点是或不是极值点来将所有点分类。在SURF算法中，选用二阶标准高斯函数作为滤波器，通过特定核间的卷积计算二阶偏导数，从而计算出Hessian矩阵，但是由于特征点需要具备尺度无关性，所以在进行Hessian矩阵构造前，需要对其进行高斯滤波（由于高斯核服从正态分布，所以为了提高运算速度，SURF采用了盒式滤波器近似代替高斯滤波器提高运算速度），即与以方差为自变量的高斯函数的二阶导数进行卷积。通过这种方法可以为图像中每个像素计算出其H的行列式的决定值，并用这个值来判别特征点。

图像金字塔

图像金字塔是一种以多分辨率来解释图像的结构，通过对原始图像进行多尺度像素采样的方式，生成N个不同分辨率的图像。把具有最高级别分辨率的图像放在底部，以金字塔形状排列，往上是一系列像素（尺寸）逐渐降低的图像，一直到金字塔的顶部只包含一个像素点的图像，这就构成了传统意义上的图像金字塔。

获得图像金字塔一般包括二个步骤：1. 利用低通滤波器平滑图像；2. 对平滑图像进行抽样（采样）。有两种采样方式——上采样（分辨率逐级升高）和下采样（分辨率逐级降低）

高斯金字塔

高斯金字塔式在Sift算子中提出来的概念，首先高斯金字塔并不是一个金字塔，而是有很多组（Octave）金字塔构成，并且每组金字塔都包含若干层（Interval）。

　　高斯金字塔构建过程：

　　1. 先将原图像扩大一倍之后作为高斯金字塔的第1组第1层，将第1组第1层图像经高斯卷积（其实就是高斯平滑或称高斯滤波）之后作为第1组金字塔的第2层，高斯卷积函数为：

　　对于参数σ，在Sift算子中取的是固定值1.6。

　　2. 将σ乘以一个比例系数k,等到一个新的平滑因子σ=k*σ，用它来平滑第1组第2层图像，结果图像作为第3层。

　　3. 如此这般重复，最后得到L层图像，在同一组中，每一层图像的尺寸都是一样的，只是平滑系数不一样。它们对应的平滑系数分别为：0，σ，kσ，k^2σ,k^3σ……k^(L-2)σ。

　　4. 将第1组倒数第三层图像作比例因子为2的降采样，得到的图像作为第2组的第1层，然后对第2组的第1层图像做平滑因子为σ的高斯平滑，得到第2组的第2层，就像步骤2中一样，如此得到第2组的L层图像，同组内它们的尺寸是一样的，对应的平滑系数分别为：0，σ，kσ，k^2σ,k^3σ……k^(L-2)σ。但是在尺寸方面第2组是第1组图像的一半。

这样反复执行，就可以得到一共O组，每组L层，共计O*L个图像，这些图像一起就构成了高斯金字塔，结构如下：

　　在同一组内，不同层图像的尺寸是一样的，后一层图像的高斯平滑因子σ是前一层图像平滑因子的k倍；在不同组内，后一组第一个图像是前一组倒数第三个图像的二分之一采样，图像大小是前一组的一半；

DOG金字塔

差分金字塔，DOG（Difference of Gaussian）金字塔是在高斯金字塔的基础上构建起来的，其实生成高斯金字塔的目的就是为了构建DOG金字塔。

　　DOG金字塔的第1组第1层是由高斯金字塔的第1组第2层减第1组第1层得到的。以此类推，逐组逐层生成每一个差分图像，所有差分图像构成差分金字塔。概括为DOG金字塔的第o组第l层图像是有高斯金字塔的第o组第l+1层减第o组第l层得到的。

　　DOG金字塔的构建可以用下图描述：

　　每一组在层数上，DOG金字塔比高斯金字塔少一层。后续Sift特征点的提取都是在DOG金字塔上进行的。

尺度空间

图像的尺度空间解决的问题是如何对图像在所有尺度下描述的问题。在高斯金字塔中一共生成O组L层不同尺度的图像，这两个量合起来（O，L）就构成了高斯金字塔的尺度空间，也就是说以高斯金字塔的组O作为二维坐标系的一个坐标，不同层L作为另一个坐标，则给定的一组坐标（O,L）就可以唯一确定高斯金字塔中的一幅图像。

　　尺度空间的形象表述：

　　上图中尺度空间中k前的系数n表示的是第一组图像尺寸是当前组图像尺寸的n倍。

上面说这么多，只是得到了一张近似hessian的行列式图，类似SIFT中的DoG图。但是在金字塔图像中分为很多层，每一层叫做一个octave，每一个octave中又有几张尺度不同的图片。在SIFT算法中，同一个octave层中的图片尺寸（大小）相同，但是尺度不同（模糊程度）不同，而不同的octave层中的图片尺寸也不相同，因为它是由上一层图片将采样得到的。在进行高斯模糊时，SIFT的高斯模板大小是始终不变的，只是在不同的octave之间改变图片的大小。而在SURF中，图片的大小是一直不变的，不同octave层的待检测图片是改变高斯模糊尺寸大小得到的，当然，同一个octave中不同图片用到的高斯模板尺寸也不同。算法允许尺度空间多层图像同时被处理，不需要对图像进行二次抽样，从而提高算法性能。

（2）利用非极大值抑制初步确定特征点

非极大值抑制

非极大值抑制，简称为NMS算法，其思想是搜素局部最大值，抑制极大值。NMS算法在不同应用中的具体实现不太一样，但思想是一样的。非极大值抑制，在计算机视觉任务中得到了广泛的应用，例如边缘检测、人脸检测、目标检测

以目标检测为例：目标检测的过程中在同一目标的位置上会产生大量的候选框，这些候选框相互之间可能会有重叠，此时我们需要利用非极大值抑制找到最佳的目标边界框，消除冗余的边界框。Demo如下图：

左图是人脸检测的候选框结果，每个边界框有一个置信度得分(confidence score)，如果不使用非极大值抑制，就会有多个候选框出现。右图是使用非极大值抑制之后的结果，符合我们人脸检测的预期结果。

如何使用非极大值

前提：目标边界框列表及其对应的置信度得分列表，设定阈值，阈值用来删除重叠较大的边界框。
IoU：intersection-over-union，即两个边界框的交集部分除以它们的并集。

非极大值抑制的流程如下：

根据置信度得分进行排序
选择置信度最高的比边界框添加到最终输出列表中，将其从边界框列表中删除
计算所有边界框的面积
计算置信度最高的边界框与其它候选框的IoU。
删除IoU大于阈值的边界框
重复上述过程，直至边界框列表为空。

此步骤和SIFT类似，将经过hessian矩阵处理过的每个像素点与其三维邻域的26个点进行大小比较，如果它是这26个点中的最大值或者最小值，则保留下来，当作初步的特征点。检测过程中使用与该尺度层图像解析度相对应大小的滤波器进行检测。

（3）精确定位极值点

这里也和SIFT算法中类似，采用三维线性插值法得到亚像素级的特征点，同时也去掉那些值小于一定阈值的点，增加极值使检测到的特征点数量减少，最终只有几个特征最强点会被检测出来。

三维线性插值法

內插是数学领域数值分析中的通过已知的离散数据求未知数据的过程或方法。

根据若干离散的数据数据，得到一个连续的函数（也就是曲线）或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。內插是曲线必须通过已知点的拟合。

1.线性插值

已知坐标 (x0, y0) 与 (x1, y1)，要得到 [x0, x1] 区间内某一位置 x 在直线上的值。

由于 x 值已知，所以可以从公式得到 y 的值

已知 y 求 x 的过程与以上过程相同，只是 x 与 y 要进行交换。

例如，

原来的数值序列：0，10，20，30，40
线性插值一次为：0，5，10，15，20，25，30，35，40
即认为其变化（增减）是线形的，可以在坐标图上画出一条直线。

线性插值经常用于补充表格中的间隔部分。

两值之间的线性插值基本运算在计算机图形学中的应用非常普遍，以至于在计算机图形学领域的行话中人们将它称为 lerp。所有当今计算机图形处理器的硬件中都集成了线性插值运算，并且经常用来组成更为复杂的运算：例如，可以通过三步线性插值完成一次双线性插值运算。由于这种运算成本较低，所以对于没有足够数量条目的光滑函数来说，它是实现精确快速查找表的一种非常好的方法。

在一些要求较高的场合，线性插值经常无法满足要求。在这种场合，可以使用多项式插值或者样条插值来代替。

线性插值可以扩展到有两个变量的函数的双线性插值。

內插是数学领域数值分析中的通过已知的离散数据求未知数据的过程或方法。

已知坐标 (x0, y0) 与 (x1, y1)，要得到 [x0, x1] 区间内某一位置 x 在直线上的值。

由于 x 值已知，所以可以从公式得到 y 的值

已知 y 求 x 的过程与以上过程相同，只是 x 与 y 要进行交换。

例如，

原来的数值序列：0，10，20，30，40
线性插值一次为：0，5，10，15，20，25，30，35，40
即认为其变化（增减）是线形的，可以在坐标图上画出一条直线。

线性插值经常用于补充表格中的间隔部分。

在一些要求较高的场合，线性插值经常无法满足要求。在这种场合，可以使用多项式插值或者样条插值来代替。

线性插值可以扩展到有两个变量的函数的双线性插值。双线性插值经常作为一种粗略的抗混叠滤波器使用，三线性插值用于三个变量的函数的插值。线性插值的其它扩展形势可以用于三角形与四面体等其它类型的网格运算。

2.三线性插值

　　三线性插值是在三维离散采样数据的张量积网格上进行线性插值的方法。这个张量积网格可能在每一维度上都有任意不重叠的网格点，但并不是三角化的有限元分析网格。这种方法通过网格上数据点在局部的矩形棱柱上线性地近似计算点 (x,y,z) 的值。

三线性插值在一次n=1三维D=3(双线性插值的维数：D=2，线性插值：D=1)的参数空间中进行运算，这样需要(1 + n)D = 8个与所需插值点相邻的数据点。
三线性插值等同于三维张量的一阶B样条插值。
三线性插值运算是三个线性插值运算的张量积。

　　实例

　　在一个步距为1的周期性立方网格上，取xd,yd,zd　为待计算点，距离小于　x,y,z,　的最大整数的差值，即，

　　 $x_d=x-\left\lfloor x\right\rfloor$

　　 $y_d=y-\left\lfloor y\right\rfloor$

　　 $z_d=z-\left\lfloor z\right\rfloor$

　　首先沿着z轴插值，得到：

　　 $i_1=v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right],\times(1-z_d)+v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right]\times z_d$

　　 $i_2=v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right],\times(1-z_d)+v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right]\times z_d$

　　 $j_1=v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right],\times(1-z_d)+v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right]\times z_d$

　　 $j_2=v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right],\times(1-z_d)+v\left[\left\lfloor x\right\rfloor,\left\lfloor y\right\rfloor\left\lfloor z\right\rfloor\right]\times z_d$

　　然后，沿着y轴插值，得到：

　　w1 = i1(1 − yd) + i2yd

　　w2 = j1(1 − yd) + j2yd

　　最后，沿着x轴插值，得到：

　　IV = w1(1 − xd) + w2xd
　　这样就得到该点的预测值。

　　三线性插值的结果与插值计算的顺序没有关系，也就是说，按照另外一种维数顺序进行插值，例如沿着 x、 y、z 顺序插值将会得到同样的结果。这也与张量积的交换律完全一致。

（4）选取特征点的主方向

这一步与SIFT也大有不同，SIFT选取特征点主方向是采用在特征点邻域统计其梯度直方图，取直方图bin值最大的以及超过bin值80%的那些方向作为特征点的主方向。
而在SURF中，不统计其梯度直方图，而是统计特征点邻域内的harr小波特征。即在特征点的邻域（比如说，半径为6s的圆内，s为该点所在的尺度）内，统计60度扇形内所有点的水平haar小波特征和垂直haar小波特征总和，haar小波的尺寸变长为4s，这样一个扇形得到了一个值，然后60度扇形以一定间隔进行旋转，最后将最大值那个扇形的方向作为该特征点的主方向。

（5）构造surf特征点描述算子

在SIFT中，是在特征点周围取16x16的邻域，并把该邻域化为4x4个的小区域，每个小区统计8个方向的梯度，最后得到4x4x8=128维的向量，该向量作为该点SIFT描述子。
在SURF中，也是在特征点周围取一个正方形框，框的边长为20s（s是所检测到该特征点所在的尺度）。该框带方向，方向当然就是第（4）步检测出来的主方向了。然后把该框分为16个子区域，每个子区域统计25个像素的水平方向和垂直方向的haar小博特征，这里的水平和垂直方向都是相对主方向而言的。该haar小波特征为水平方向值之和，水平方向绝对值之和，垂直方向之和，垂直方向绝对值之和。这样每个区域就有4个值，所以每个特征点就是16x4=64维向量，相比于SIFT而言，少了一半，这在特征匹配过程中会大大加快匹配速度。

SURF采用Hessian矩阵获取图像局部最值十分稳定，但是在求主方向阶段太过于依赖局部区域像素的梯度方向，有可能使找到的主方向不准确。后面的特征向量提取以及匹配都严重依赖于主方向，即使不大偏差角度也可以造成后面特征匹配的放大误差，从而使匹配不成功。另外图像金字塔的层取得不够紧密也会使得尺度有误差，后面的特征向量提取同样依赖响应的尺度，发明者在这个问题上的折中解决办法是取适量的层然后进行插值。

（6）特征点匹配

Surf通过计算两个特征点间的欧式距离来确定匹配度，欧氏距离越短，代表两个特征点的匹配度越好。Surf还加入了Hesgian矩阵迹的判断，如果两个特征点的矩阵迹正负号相同，代表这两个特征具有相同方向上的对比度变化，如果不同，说明这两个特征点的对比度变化方向是相反的，即使欧氏距离为0,也直接予以排除chong

代码实现：

#include 
#include 
#include "opencv2/core.hpp"
#include "opencv2/core/utility.hpp"
#include "opencv2/core/ocl.hpp"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/highgui.hpp"
#include "opencv2/features2d.hpp"
#include "opencv2/calib3d.hpp"
#include "opencv2/imgproc.hpp"
#include "opencv2/xfeatures2d.hpp"

using namespace cv;
using namespace cv::xfeatures2d;

const int LOOP_NUM = 10;
const int GOOD_PTS_MAX = 50;
const float GOOD_PORTION = 0.15f;

int64 work_begin = 0;
int64 work_end = 0;

static void workBegin()
{
    work_begin = getTickCount();
}

static void workEnd()
{
    work_end = getTickCount() - work_begin;
}

static double getTime()
{
    return work_end /((double)getTickFrequency() )* 1000.;
}

struct SURFDetector
{
    Ptr surf;
    SURFDetector(double hessian = 800.0)
    {
        surf = SURF::create(hessian);
    }
    template
    void operator()(const T& in, const T& mask, std::vector& pts, T& descriptors, bool useProvided = false)
    {
        surf->detectAndCompute(in, mask, pts, descriptors, useProvided);
    }
};

template
struct SURFMatcher
{
    KPMatcher matcher;
    template
    void match(const T& in1, const T& in2, std::vector& matches)
    {
        matcher.match(in1, in2, matches);
    }
};

static Mat drawGoodMatches(
    const Mat& img1,
    const Mat& img2,
    const std::vector& keypoints1,
    const std::vector& keypoints2,
    std::vector& matches,
    std::vector& scene_corners_
    )
{
    //-- Sort matches and preserve top 10% matches
    std::sort(matches.begin(), matches.end());
    std::vector< DMatch > good_matches;
    double minDist = matches.front().distance;
    double maxDist = matches.back().distance;

    const int ptsPairs = std::min(GOOD_PTS_MAX, (int)(matches.size() * GOOD_PORTION));
    for( int i = 0; i < ptsPairs; i++ )
    {
        good_matches.push_back( matches[i] );
    }
    std::cout << "\nMax distance: " << maxDist << std::endl;
    std::cout << "Min distance: " << minDist << std::endl;

    std::cout << "Calculating homography using " << ptsPairs << " point pairs." << std::endl;

    // drawing the results
    Mat img_matches;

    drawMatches( img1, keypoints1, img2, keypoints2,
                 good_matches, img_matches, Scalar::all(-1), Scalar::all(-1),
                 std::vector(), DrawMatchesFlags::NOT_DRAW_SINGLE_POINTS  );

    //-- Localize the object
    std::vector obj;
    std::vector scene;

    for( size_t i = 0; i < good_matches.size(); i++ )
    {
        //-- Get the keypoints from the good matches
        obj.push_back( keypoints1[ good_matches[i].queryIdx ].pt );
        scene.push_back( keypoints2[ good_matches[i].trainIdx ].pt );
    }
    //-- Get the corners from the image_1 ( the object to be "detected" )
    std::vector obj_corners(4);
    obj_corners[0] = Point(0,0);
    obj_corners[1] = Point( img1.cols, 0 );
    obj_corners[2] = Point( img1.cols, img1.rows );
    obj_corners[3] = Point( 0, img1.rows );
    std::vector scene_corners(4);

    Mat H = findHomography( obj, scene, RANSAC );
    perspectiveTransform( obj_corners, scene_corners, H);

    scene_corners_ = scene_corners;

    //-- Draw lines between the corners (the mapped object in the scene - image_2 )
    line( img_matches,
          scene_corners[0] + Point2f( (float)img1.cols, 0), scene_corners[1] + Point2f( (float)img1.cols, 0),
          Scalar( 0, 255, 0), 2, LINE_AA );
    line( img_matches,
          scene_corners[1] + Point2f( (float)img1.cols, 0), scene_corners[2] + Point2f( (float)img1.cols, 0),
          Scalar( 0, 255, 0), 2, LINE_AA );
    line( img_matches,
          scene_corners[2] + Point2f( (float)img1.cols, 0), scene_corners[3] + Point2f( (float)img1.cols, 0),
          Scalar( 0, 255, 0), 2, LINE_AA );
    line( img_matches,
          scene_corners[3] + Point2f( (float)img1.cols, 0), scene_corners[0] + Point2f( (float)img1.cols, 0),
          Scalar( 0, 255, 0), 2, LINE_AA );
    return img_matches;
}


// This program demonstrates the usage of SURF_OCL.
// use cpu findHomography interface to calculate the transformation matrix
int main(int argc, char* argv[])
{
    const char* keys =
        "{ h help     |                  | print help message  }"
        "{ l left     | box.png          | specify left image  }"
        "{ r right    | box_in_scene.png | specify right image }"
        "{ o output   | SURF_output.jpg  | specify output save path }"
        "{ m cpu_mode |                  | run without OpenCL }";

    CommandLineParser cmd(argc, argv, keys);
    if (cmd.has("help"))
    {
        std::cout << "Usage: surf_matcher [options]" << std::endl;
        std::cout << "Available options:" << std::endl;
        cmd.printMessage();
        return EXIT_SUCCESS;
    }
    if (cmd.has("cpu_mode"))
    {
        ocl::setUseOpenCL(false);
        std::cout << "OpenCL was disabled" << std::endl;
    }

    UMat img1, img2;

    std::string outpath = cmd.get("o");

    std::string leftName = cmd.get("l");
    imread("../1.jpg", IMREAD_GRAYSCALE).copyTo(img1);
    if(img1.empty())
    {
        std::cout << "Couldn't load " << leftName << std::endl;
        cmd.printMessage();
        return EXIT_FAILURE;
    }

    std::string rightName = cmd.get("r");
    imread("../1.jpg", IMREAD_GRAYSCALE).copyTo(img2);
    if(img2.empty())
    {
        std::cout << "Couldn't load " << rightName << std::endl;
        cmd.printMessage();
        return EXIT_FAILURE;
    }

    double surf_time = 0.;

    //declare input/output
    std::vector keypoints1, keypoints2;
    std::vector matches;

    UMat _descriptors1, _descriptors2;
    Mat descriptors1 = _descriptors1.getMat(ACCESS_RW),
        descriptors2 = _descriptors2.getMat(ACCESS_RW);

    //instantiate detectors/matchers
    SURFDetector surf;

    SURFMatcher matcher;

    //-- start of timing section

    for (int i = 0; i <= LOOP_NUM; i++)
    {
        if(i == 1) workBegin();
        surf(img1.getMat(ACCESS_READ), Mat(), keypoints1, descriptors1);
        surf(img2.getMat(ACCESS_READ), Mat(), keypoints2, descriptors2);
        matcher.match(descriptors1, descriptors2, matches);
    }
    workEnd();
    std::cout << "FOUND " << keypoints1.size() << " keypoints on first image" << std::endl;
    std::cout << "FOUND " << keypoints2.size() << " keypoints on second image" << std::endl;

    surf_time = getTime();
    std::cout << "SURF run time: " << surf_time / LOOP_NUM << " ms" << std::endl<<"\n";


    std::vector corner;
    Mat img_matches = drawGoodMatches(img1.getMat(ACCESS_READ), img2.getMat(ACCESS_READ), keypoints1, keypoints2, matches, corner);

    //-- Show detected matches

    namedWindow("surf matches", 0);
    imshow("surf matches", img_matches);
    imwrite(outpath, img_matches);

    waitKey(0);
    return EXIT_SUCCESS;
}

效果图：

补充：

卷积的理解：

用一个例子来说明

如下图所示，输入信号是 f(t) ，是随时间变化的。系统响应函数是 g(t) ，图中的响应函数是随时间指数下降的，它的物理意义是说：如果在 t =0 的时刻有一个输入，那么随着时间的流逝，这个输入将不断衰减。换言之，到了 t =T时刻，原来在 t =0 时刻的输入 f (0)的值将衰减为 f (0) g (T)。

考虑到信号是连续输入的，也就是说，每个时刻都有新的信号进来，所以，最终输出的是所有之前输入信号的累积效果。如下图所示，在T=10时刻，输出结果跟图中带标记的区域整体有关。其中，f(10)因为是刚输入的，所以其输出结果应该是f(10)g(0)，而时刻t=9的输入f(9)，只经过了1个时间单位的衰减，所以产生的输出应该是 f(9)g(1)，如此类推，即图中虚线所描述的关系。这些对应点相乘然后累加，就是T=10时刻的输出信号值，这个结果也是f和g两个函数在T=10时刻的卷积值。
————————————————

原论文的下载链接：

surf算法的原始论文-机器学习文档类资源-CSDN下载

部分推导过程：

SURF的特征点检测方法脱胎于 DoH 特征点检测方法， DoH 特征点检测方法计算图像点的Hessian矩阵的行列值来确定该像素点是否为特征点。

$h=\begin{bmatrix} Lxx&Lxy \\ Lxy&Lyy \end{bmatrix}$

其中，代表高斯正态分布对x的二阶导数与该像素点的卷积值；

代表高斯正态分布的xy二阶导数与该像素点的卷积值，以此类推代表高斯正态分布对y的二阶导数与该像素点的卷积值。我们知道Hessian矩阵与多元函数的极值点密切相关。

1 —如果Hessian矩阵是一个正定矩阵，那么该点是该多元函数的局部极小值点。
2 —如果Hessina矩阵是一个负定矩阵，那么该点是该多元函数的局部极大值点。
3 —如果Hessian矩阵是一个不定矩阵，那么该点不能确定是否为函数的极值点。
当然我们还要清楚一个事实一个函数与高斯正态分布的导数求卷积相当于对该函数直接求导。

所以上述的Hessian矩阵由对应的高斯正态分布的导数与图像的卷积求得与直接对图像点进行求导的意义是一样的，但是SURF方法运用了积分图像与盒子滤波器可以简化运算，盒子滤波器是一种对于高斯正态分布导数的近似。

对于函数：

其对x的二阶偏导数：

用 matlab 画出二阶偏导数的图像：

接下来从Z轴方向观察上面的图形：

可以发现这就是盒子滤波器的精确版本，但是为了与积分图像结合，论文中对上述图像进行了简化.同样我们可以得的图像与其盒子滤波器的近似；

从Z轴观察上述图像分别为：

其对应的盒子滤波器的近似图像我们称之为

图像如下图所示：
对于公式(1)我们可以得到如下的数学推导：

Sift实现代码

#include 
#include 
#include 

using std::cout;
using std::endl;
using std::vector;
using cv::Mat;
using cv::xfeatures2d::SiftFeatureDetector;
using cv::xfeatures2d::SiftDescriptorExtractor;

int main()
{
    // 从文件中读入图像
    Mat src_img1 = cv::imread("../zhy1.jpeg");
    Mat img1;
    cv::resize(src_img1, img1, cv::Size(512, 512));
    Mat src_img2 = cv::imread("../zhy2.jpeg");
    Mat img2;
    cv::resize(src_img2, img2, cv::Size(512, 512));
    if (img1.empty())
    {
        cout << "Image-1 loading failed, please check !!!" << endl;
        system("Pause");
        return -1;
    }
    if (img2.empty())
    {
        cout << "Image-2 loading failed, please check !!!" << endl;
        system("Pause");
        return -1;
    }
    cv::imshow("image before", img1);
    cv::imshow("image2 before", img2);

    // SIFT - 检测关键点并在原图中绘制
    int kp_number{ 50 };
    vector kp1, kp2;
    cv::Ptr siftdtc = SiftFeatureDetector::create(kp_number);
    siftdtc->detect(img1, kp1);
    Mat outimg1;
    cv::drawKeypoints(img1, kp1, outimg1);
    cv::imshow("image1 keypoints", outimg1);
    vector::iterator itvc;
    for (itvc = kp1.begin(); itvc != kp1.end(); itvc++)
    {
        cout << "angle:" << itvc->angle << "\t" << itvc->class_id << "\t" << itvc->octave << "\t" << "pt ->" << itvc->pt << "\t" << itvc->response << "\t" << itvc->size << endl;
    }
    siftdtc->detect(img2, kp2);
    Mat outimg2;
    cv::drawKeypoints(img2, kp2, outimg2);
    cv::imshow("image2 keypoints", outimg2);

    // SIFT - 特征向量提取
    cv::Ptr extractor = SiftDescriptorExtractor::create();
    Mat descriptor1, descriptor2;
    extractor->compute(img1, kp1, descriptor1);
    extractor->compute(img2, kp2, descriptor2);
    cv::imshow("desc", descriptor1);
    cout << endl << "The size of feature matrix is: " << descriptor1.rows << "×" << descriptor1.cols << endl;

    // 两张图像的特征匹配
    cv::Ptr matcher = cv::DescriptorMatcher::create("BruteForce");
    vector matches;
    Mat img_matches;
    matcher->match(descriptor1, descriptor2, matches);
    cv::drawMatches(img1, kp1, img2, kp2, matches, img_matches);
    imshow("matches", img_matches);

    cv::waitKey(0);
    return 0;
}

参考:

Opencv学习之SURF算法
harr特征以及积分图像
harr特征以及积分图像
Hessian矩阵
sift算法
图像金字塔、高斯金字塔、差分金字塔（DOG金字塔）、尺度空间、DoG (Difference of Gaussian)角点检测
非极大值抑制
卷积的理解
surf相关数学推导

你可能感兴趣的:(ubuntu,opencv2,ubuntu,opencv)

ubuntu 查看防火墙相关操作三希 windows
在Ubuntu系统里，查看防火墙状态和配置主要借助ufw（UncomplicatedFirewall）工具，它是Ubuntu默认的防火墙配置界面。下面为你介绍常用的查看命令：一、查看防火墙状态要查看防火墙是否处于运行状态，可以使用以下命令：bashsudoufwstatus或者使用更详细的版本：bashsudoufwstatusverbose输出结果里，Status:active意味着防火墙正在运
在Windows11上安装Linux操作系统的几种技术方案 yuanpan linux 运维服务器
在Windows11上安装Linux主要有以下几种技术方案，每种方案适用于不同的需求场景：1.WindowsSubsystemforLinux(WSL)适用场景：开发、命令行工具、轻量级Linux环境支持发行版：Ubuntu、Debian、KaliLinux、Fedora等优点：轻量级：无需虚拟机，直接在Windows上运行Linux命令行环境。无缝集成：可访问Windows文件系统，支持VSCo
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
在Ubuntu24.04搭建VLLM， SGLang 和 LangChain环境小熊冲！冲！冲！ AI ubuntu langchain ai 毕业设计
在Ubuntu24.04搭建VLLM，SGLang和LangChain环境[!NOTE]概述整片文章是笔者的回忆(白天忙碌了一天，晚上进行的总结)，所以有些地方的描述可能有误差，本文更多的是大体方向问题，细节步骤不是本文的重点，见谅!!!如何安装Ubuntu24.04制作启动U盘，作者使用的是rufus.exe工具下载Ubuntu24.04的ISO镜像使用rufus.exe工具刷入Ubuntu22
Ubuntu Docker 安装Redis LLLL96 Ubuntu docker docker redis ubuntu
目录介绍1.数据结构丰富2.高性能3.持久化1.拉取Redis镜像2.创建挂载目录(可选)3.配置Redis持久化(可选)4.使用配置文件运行容器5.查看redis日志介绍1.数据结构丰富Redis支持多种数据结构，包括：字符串（String）:可以用来存储任何类型的数据，例如文本、数字或二进制数据。哈希（Hash）:存储字段和值的映射，适合用于表示对象。列表（List）:有序的字符串列表，可以用
Ubuntu24安装MariaDB/MySQL后不知道root密码如何解决
Ubuntu24.04安装MariaDB后root密码未知？解决方案在此在Ubuntu24.04上新安装MariaDB后，许多用户会发现自己不知道root用户的密码，甚至在安装过程中也没有提示设置密码。这是因为在较新的MariaDB版本中，默认情况下root用户采用了unix_socket身份验证插件。这意味着您可以使用操作系统的root用户权限直接登录MariaDB，而无需输入密码。本文将为您详
VirtualBox安装Ubuntu 22.04后终端无法打开的解决方案 yuanpan ubuntu linux 运维
问题现象在VirtualBox中使用"快速安装"模式安装Ubuntu22.04后图形终端（gnome-terminal）无法通过图标或快捷键(Ctrl+Alt+T)启动系统其他功能正常根本原因语言环境(Locale)配置异常导致：快速安装模式可能跳过Locale生成步骤gnome-terminal依赖的本地化资源加载失败解决方案▶方法1：修复Locale配置（推荐）进入TTY终端快捷键：Ctrl+
ubuntu qt环境下出现No suitable kits found解决方案
1.清理QtCreator缓存QtCreator会缓存项目配置、索引等数据，可能导致某些异常。清理方法：(1)删除QtCreator配置目录bashrm-rf~/.config/QtProject/（Ubuntu/Linux）或Windows：cmdrmdir/s/q"%APPDATA%\QtProject"(2)清除QtCreator的编译缓存bashrm-rf~/.cache/QtProjec
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和使用 NoMachine 山岚的运维笔记 Linux 运维及使用 linux ubuntu 运维 nomachine 远程连接
NoMachine是一款适用于Linux（Ubuntu）及其他支持的操作系统的远程桌面应用程序，允许用户通过本地或远程系统从世界任何地方控制计算机。它可以在低带宽连接下工作，被专业人士和家庭用户广泛使用。NoMachine的主要功能高性能远程访问跨平台兼容性易于使用，因为用户界面友好提供强大的加密协议，如SSH、SSL及其他安全标准支持远程文件传输和打印服务允许从远程计算机进行音频和视频流媒体传输
ubuntu的redis反弹shell总结 chanra 萌新随笔 ubuntu redis linux
ubuntu的redis反弹shell总结ubuntu要执行有三点：1、ubuntu的默认执行命令的为/bin/dash，我们使用bash-i肯定是弹不了的。2、ubuntu计划任务运行有语法要求，redis写入的文件存在缓存数据，导致语法错误无法运行计划任务。3、文件需要是600rw权限，权限不对也不能运行，不过我直接写入貌似就是600rw。参考链接：http://www.vkxss.top/2
Ubuntu安装LAMP L_h1 测试 ubuntu linux
在安装vim时遇到了一个问题：E:无法获得锁/var/lib/dpkg/lock-frontend-open(11:资源暂时不可用)E:无法获取dpkg前端锁(/var/lib/dpkg/lock-frontend)，是否有其他进程正占用它？解决办法：强制解锁sudorm/var/lib/dpkg/lock-frontendsudorm/var/cache/apt/archives/locksud
ubnutu网络
ubnutu网络‍在Ubuntu系统中连接外网（外部网络）的方法主要取决于你的网络环境（有线/无线）和网络类型（DHCP自动分配或静态IP），以下是常见的连接方式：一、通过图形界面连接（适合桌面版）1.有线网络（以太网）直接用网线连接电脑和路由器/交换机，系统通常会自动检测并通过DHCP获取IP地址，无需额外配置。若未自动连接：点击屏幕右上角的网络图标（类似Wi-Fi或网线图标）。在弹出的菜单中，
Ubuntu“root“登录
Ubuntu"root"登录前言Ubuntu默认禁止root用户登录，若要设置为默认root登录，需先开启root用户登录权限，再配置自动登录，具体操作如下：‍‍开启root用户登录权限设置root用户密码：打开终端，输入命令sudopasswdroot，根据提示输入并确认root用户的密码。修改登录配置文件：使用命令sudonano/usr/share/lightdm/lightdm.conf.
Ubuntu lamp 会飞的灰大狼 linux ubuntu
Ubuntulamp前言在Ubuntu安装lamp架构我们了解到lamp是完整的架构我们前面了解到了集合了Linux系统apacheMySQL和PHP语言的完整架构我们前面说了Centos7中编译安装lamp那么我们去说一下在Ubuntu中安装‍‍安装apache2‍apt直接安装apache2apt-yinstallapache2‍启动apache2systemctlstartapache2#测
使用OpenCV对视频进行处理：视频读取、视频显示和视频保存，视频追踪等无规则ai OpenCV opencv 人工智能计算机视觉 python
一.视频的读写1.从文件中读取视频并播放（1）创建读取视频的对象cap=cv2.VideoCapture(filepath)filepath：视频文件的路径（2）视频的属性信息a.获取视频的某些属性retval=cap.get(propId)propId：从0到18的数字，每个数字表示视频的属性常用的属性有属性名对应数值功能描述CAP_PROP_POS_MSEC0视频当前的播放位置，单位为毫秒。C
ubuntu之坑（十四）——安装FFmpeg进行本地视频推流（在海思平台上运行）光电的一只菜鸡 linux虚拟机 ubuntu ffmpeg 音视频
1.编译x264（没有x264依赖项参考，有则跳过）参考blog：ubuntu22.04下编译ffmpeg-6.0,并且激活x264编码功能。记录一下踩坑（ERROR:x264notfoundusingpkg-config）需要注意：sudo./configure--enable-static--prefix=/usr/local/x264 在执行上面命令时可能遇到下面问题，这是在Linux
OpenCV读取视频帧卡死的BUG修复 henysugar opencv 音视频 bug
OpenCV读取指定视频文件如果异常的时候，会卡死一直不退出，问题是卡在CvCapture_MSMF::grabVideoFrame函数内，跟了一下，发现有个判断有点问题，其下面的源码：while(!stopFlag) { for(;;) { CV_TRACE_REGION("ReadSample"); if(!SUCCEEDED(hr=videoFileSour
为ubuntu系统制作deb安装包 ManualZhang ubuntu linux 运维 bash debian
依赖sudoapt-getinstallbuild-essentialdebhelpermakeautoconfautomakedpkg-devfakerootpbuildergnupg准备deb包创建资源文件夹，形式结构如下：deb包的文件夹模仿linux系统的根目录/的结构安装时系统会自动解包到根目录的对应文件夹下，卸载时也是自动删除对应的文件夹下的文件，如果文件夹只有一个文件，那么文件夹也可
【免费下载】 Ubuntu 20.04 net-tools 离线安装包 & ifconfig 离线安装指南凌同季
Ubuntu20.04net-tools离线安装包&ifconfig离线安装指南【下载地址】Ubuntu20.04net-tools离线安装包ifconfig离线安装指南针对无法连接互联网的生产环境，我们经常会遇到一些基本网络工具的缺失问题，尤其是像`ifconfig`这样的常用命令。Ubuntu20.04默认不再包含`net-tools`包，这使得在这些系统上手动配置网络变得稍微复杂。为此，我们
AI 绘画 + 编程：10 分钟生成个性化艺术作品大力出奇迹985 人工智能
本文围绕Python+OpenCV实现自动人脸识别门禁系统展开，先概述系统的基本构成与作用，再从系统核心技术、开发实现步骤、功能扩展方向、实际应用场景及优化改进策略五个方面详细阐述，最后总结系统的价值与发展前景，为相关开发和应用提供全面参考。一、系统核心技术解析人脸识别技术是门禁系统的核心，其关键在于对人脸特征的精准提取与匹配。OpenCV作为开源计算机视觉库，提供了丰富的人脸检测算法，如Haar
RK3568平台（camera篇）opencv处理图像嵌入式_笔记瑞芯微 opencv 人工智能计算机视觉
一.颜色转换cv2.cvtColor()函数功能：将一幅图像从一个色彩空间转换到另一个色彩空间。函数原型：cv2.cvtColor(src,code,dst=None,dstCn=None)参数定义：src:要转换的源文件code，转换的色彩空间，在opencv中有超过150种颜色空间转换方法,但是经常用的只有BGR-灰度图和BGR-HSVBGR和灰度图的转换使用cv2.COLOR_BGR2GRA
ubuntu国内镜像源手动配置鬼才血脉 ubuntu linux 运维
备份当前源列表打开终端，执行以下命令备份当前的源列表：sudocp/etc/apt/sources.list/etc/apt/sources.list.backup编辑源列表文件使用文本编辑器编辑/etc/apt/sources.list文件，例如使用nano：sudovim/etc/apt/sources.list添加或修改镜像源将文件中的内容替换为适合的国内镜像源地址。例如，使用阿里云的镜像源
RK3568笔记九十二：QT使用Opencv显示摄像头殷忆枫 RK3568学习笔记笔记
若该文为原创文章，转载请注明原文出处。测试使用QT调用Opencv的API显示摄像头，板子为正点原子的RK3568，最终想实现的是在RK3568平台上使用Qt框架进行部署，利用NPU推理加速视频目标识别。此篇为测试功能代码为正点原子提供的代码，直接用来测试，在未看代码时一直不明白怎么添加opencv的库，后面明白了，只增加了下面的两行：CONFIG+=link_pkgconfigPKGCONFIG
《零基础入门AI：从图像梯度到凸包特征检测（OpenCV图像特征提取）》竹子_23 OpenCV入门 opencv 人工智能计算机视觉
一、图像梯度处理：理解像素变化的本质1.1图像梯度基础图像梯度是计算机视觉中的核心概念，它描述了图像中像素强度的变化情况：梯度方向：像素值变化最剧烈的方向（垂直于边缘）梯度幅度：像素值变化的强度（值越大表示边缘越明显）物理意义：就像地形图中的等高线，梯度大的地方相当于陡坡，梯度小的地方相当于平地1.2垂直边缘提取垂直边缘是图像中物体左右边界形成的线条：特征：水平方向上像素值发生突变应用场景：文档扫
《零基础入门AI：OpenCV图像预处理进一步学习》竹子_23 OpenCV入门 opencv 人工智能学习
本文全面讲解OpenCV图像预处理的七大核心技术（插值方法、边缘填充、图像矫正（透视变换）、图像掩膜、ROI切割、图像添加水印、图像噪点消除），每个知识点都配有详细解释和实用代码示例，帮助初学者建立系统的图像处理知识体系。一、插值方法：图像缩放的核心技术插值是在图像缩放或旋转时估算新像素值的方法，不同方法在速度和质量上有显著差异。1.最近邻插值原理：直接取最邻近像素的值特点：速度最快，但会产生锯齿
OpenCV基础02_图像预处理白槿_cha 计算机视觉基础 opencv 人工智能计算机视觉笔记
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学一、图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂
小白学视觉 | 在OpenCV中进行图像预处理双木的木深度学习拓展阅读人工智能机器学习深度学习 opencv 计算机视觉图像处理 ai
本文来源公众号“小白学视觉”，仅用于学术分享，侵权删，干货满满。原文链接：在OpenCV中进行图像预处理今天，我们进一步深入，并处理在图像处理中常用的形态学操作。形态学操作用于提取区域、边缘、形状等。什么是形态学操作？形态学操作是在二值图像上进行的。二值图像可能包含许多不完美之处。特别是由一些简单的阈值操作产生的二值图像（如果你对阈值不熟悉，现在不用担心）可能包含许多噪声和畸变。OpenCV库中提
【OpenCV基础】凸包检测、Harris角点检测、Canny边缘检测
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载请注明出处文章目录一、凸包检测API1.drawContours2.convexHull全部代码-有滑动条效果展示部分代码-无滑动条二、Harris角点检测角
使用Python，OpenCV计算跑图的图像彩色度程序媛一枚~ Python OpenCV Python进阶 python opencv 开发语言
使用Python，OpenCV计算跑图的图像彩色度这篇博客将介绍如何计算跑图里最鲜艳的top25图片和最灰暗的top25图片并显示色彩彩色度值展示。效果图以下分别是最鲜艳top25和最灰暗top25对比效果图：最鲜艳top25效果图：最灰暗top25效果图如下：源码见如下链接https://blog.csdn.net/qq_40985985/article/details/115014533#US
OpenCV（11）边缘检测、轮廓绘制、简单平移距离测量 C++ sam-zy
1.边缘检测原文链接：http://blog.sina.com.cn/s/blog_154bd48ae0102weuk.html边缘检测的一般步骤：1.滤波边缘检测的算法主要是基于图像的一阶和二阶导数。但是导数通常对噪声很敏感，所以首先要用滤波器降低噪声。常见的滤波方法主要是高斯滤波。2.增强增强边缘的基础是确定图像各点领域强度的变化值。增强算法可以将图像灰度点邻域强度值有显著变化的点凸现出来，在
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h