乔qiao

经典算法研究（1）：SIFT算法1

作者：qxl 邮箱： [email protected]

系列文章链接

一、经典算法研究（1）：SIFT算法1
二、经典算法研究（1）：SIFT算法2
三、

文章目录

系列文章链接
前言
一、Sift算法原理介绍
- 1.0 基础概念
- - 高斯金字塔
  - 八度
  - 为什么要构建高斯金字塔？
  - 高斯金字塔构建步骤
  - 如何描述尺度空间？
  - 构建差分高斯金字塔
  - 尺度空间的连续性
  - 下一个八度的第一幅图像如何确定

前言

学习sift算法记录

一、Sift算法原理介绍

尺度不变特征变换（Scale-invariant feature transform 或sift）算法是用来检测与描述图像中的局部特征，在空间尺度中寻找极值点，并提取出位置、尺度、旋转不变量，此算法由David Lowe在1999年发表，2004年完善总结。

1.0 基础概念

高斯金字塔

对于高斯金字塔，很容易直观地理解为对同一尺寸的图像进行不同程度的高斯平滑，这些图像的组合构成高斯金字塔，但这种理解实际是不对的，该图像集合叫做一个八度。金字塔总要有个变“尖”的过程，真正的高斯金字塔要有个平滑以及下采样的过程，因此整个图像平滑以及下采样再平滑，构成的所有图像集合才构成了图像的高斯金字塔。

八度

简单地说八度就是在特定尺寸(长宽)下，经不同高斯核模糊的图像的集合。八度的集合是高斯金字塔。

为什么要构建高斯金字塔？

整个高斯金字塔，或者说是差分高斯金字塔是我们确定SIFT特征的基础，让我们首先想想高斯金字塔到底干了一件什么事情，他到底模仿的是什么？答案很容易确定，高斯金字塔模仿的是图像的不同的尺度，尺度应该怎样理解？对于一副图像，你近距离观察图像，与你在一米之外观察，看到的图像效果是不同的，前者比较清晰，后者比较模糊，前者比较大，后者比较小，通过前者能看到图像的一些细节信息，通过后者能看到图像的一些轮廓的信息，这就是图像的尺度，图像的尺度是自然存在的，并不是人为创造的。好了，到这里我们明白了，其实以前对一幅图像的处理还是比较单调的，因为我们的关注点只落在二维空间，并没有考虑到“图像的纵深”这样一个概念，如果将这些内容考虑进去我们是不是会得到更多以前在二维空间中没有得到的信息呢？于是高斯金字塔横空出世了，它就是为了在二维图像的基础之上，榨取出图像中自然存在的另一个维度：尺度。因为高斯核是唯一的线性核，也就是说使用高斯核对图像模糊不会引入其他噪声，因此就选用了高斯核来构建图像的尺度。

下图两幅图像是典型的图像高斯金字塔，这就是模仿的图像离你远去时在你视网膜上的成像，图像分别以动态方式表示。

高斯金字塔构建步骤

根据Lowe的论文，高斯金字塔的构建还是比较简单的，高斯卷积和是尺度变换的唯一的线性核。

高斯金字塔构建过程中，一般首先将图像扩大一倍（这步操作有什么深意吗？），在扩大的图像的基础之上构建高斯金字塔，然后对该尺寸下图像进行高斯模糊，几幅模糊之后的图像集合构成了一个八度，然后对该八度下的最模糊的一幅图像进行下采样的过程，长和宽分别缩短一倍，图像面积变为原来四分之一。这幅图像就是下一个八度的初始图像，在初始图像图像的基础上完成属于这个八度的高斯模糊处理，以此类推完成整个算法所需要的所有八度构建，这样这个高斯金字塔就构建出来了。构建出的金字塔如下图所示：

如何描述尺度空间？

以上已经从人视觉感知的角度让大家感性认识到了“尺度”，上文也提到使用高斯核来实现尺度的变换，那么具体实现过程中，尺度体现在哪里？是如何量化的呢？在高斯金字塔中，两个变量很重要，即第几个八度（o）和八度中的第几层（s），这两个量合起来（o，s）就构成了高斯金字塔的尺度空间。尺度空间也不难理解，首先一个八度中图像的长和宽是相等的，即变量o控制的是塔中尺寸这个尺度；区分同一个尺寸尺度下的图像，就需要s了，s控制了一个八度中不同的模糊程度。这样（o，s）就能够确定高斯金字塔中的唯一一幅图像了，这是个三维空间，两维坐标，一维是图像。

根据lowe的论文，（o，s）作用于一幅图像是通过公式
$\sigma = \sigma_{0} 2^{\sigma + s/S}$ 确定的。通过公式也可以看出，尺度空间是连续的，两个变量控制这 $\sigma$ 的值，其中在第一个八度中， $1 < (o + s / S) < = 2$ ，同理在第二个八度中有 $2 < (o + s / S) < = 3$ ，以此类推， $\sigma$ 中的关键部分 $(o + s / S)$ 是逐渐增大的（具体实现时，有些高斯金字塔这个值是增大，但不是逐渐均匀增大的，只能说是连续）。
如果令
$k=2^{1/S}$
则 $\sigma = \sigma_{0} 2^{\sigma + s/S}$
可以转换为
$\sigma=\sigma_{0}2^{o}·k^{s}$
所以每增加一级八度， $\sigma$ 都要扩大两倍，在一个八度中，k的上标s来区分不同的高斯核。

至此，高斯金字塔中的尺度空间已经说得差不多了，包括尺度是什么，包括高斯金字塔中尺度的连续性，后文将详细说明尺度空间的连续性。

构建差分高斯金字塔

构建高斯金字塔是为了后续构建差分高斯金字塔。对同一个八度的两幅相邻的图像做差得到插值图像，所有八度的这些插值图像的集合，就构成了差分高斯金字塔。过程如下图所示，差分高斯金字塔的好处是为后续的特征点的提取提供了方便。

到这里，高斯金字塔构建的主要部分、关键点都弄好了，一些非常重要的认知就要呼之欲出了，下面解释整个空间的尺度连续性！这是差分高斯金字塔的重中之重！

尺度空间的连续性

这里注意，连续性的主语既不是高斯金字塔，也不是差分高斯金字塔，而是尺度空间。在弄清楚这个问题之前，我们还需要解决一个问题，即为什么高斯金字塔中每个八度有s+3幅高斯图像？s的意思是将来我们在差分高斯金字塔中求极值点的时候，我们要在每个八度中求s层点，通过lowe论文可知，每一层极值点是在三维空间（图像二维，尺度一维）中比较获得，因此为了获得s层点，那么在差分高斯金字塔中需要有s+2图像(头尾为什么去掉呢？？？)，好了，继续上溯，如果差分高斯金字塔中有s+2幅图像，那么高斯金字塔中就必须要有s+3幅图像了，因为差分高斯金字塔是由高斯金字塔相邻两层相减得到的。好了，到了这里似乎真相大白，但是我们上面的推导有一个致命的问题，我们上来就假设“我们要在每个八度中求s层点”，为什么要s层点呢？这才是这个小节的主题：是为了保持尺度的连续性！下面进行详细的分析：

以一个八度中的图像为例说明（此处最好结合OpenCV中金字塔构建部分的源码<下文已列出，可以参照>）

在low的论文中S=3, 因此有
$k = 2^{1/3}$
因此，当前八度中各高斯图像的尺度依次为：
$\sigma, 2^{(1/3)}\sigma, 2^{(2/3)}\sigma, 2^{(3/3)}\sigma, 2^{(4/3)}\sigma, 2^{(5/3)}\sigma;$
当前八度中各差分高斯图像的尺度依次为：
σ，2^(1/3)σ， 2^(2/3)σ， 2^(3/3)σ， 2^(4/3)σ
同理，我们可以推断出，下一个八度中各高斯图像的尺度依次为：
$2×\sigma, 2×2^{(1/3)}\sigma, 2×2^{(2/3)}\sigma, 2×2^{(3/3)}\sigma, 2×2^{(4/3)}\sigma, 2×2^{(5/3)}\sigma;$
下一个八度中各差分高斯图像的尺度依次为：
2xσ，2x2^(1/3)σ， 2x2^(2/3)σ， 2x2^(3/3)σ， 2x2^(4/3)σ

可以观察到，其中红色标注数据所代表的层，是差分高斯金字塔中获得极值点的层，也就是说只有在这些层上才发生与上下两层比较获得极值点的操作。

如果将红色数据连成一串，这些数据就是连续的，我们通过在每个八度中多构造三幅高斯图像，达到了尺度空间连续的效果，这一效果带来的直接的好处是在尺度空间的极值点确定过程中，我们不会漏掉任何一个尺度上的极值点，而是能够综合考虑量化的尺度因子

下一个八度的第一幅图像如何确定

   这个问题，是上面问题（尺度空间的连续性）的延伸，我们可以通过反推OpenCV中这一部分的源代码，来理解这个问题。
   当前八度中的第一幅图像是通过前一个八度的倒数第三幅图像得到。OpenCV这段源码有个很重要的问题：不同的八度间的尺度不是会有一个2的差异吗？为什么本部分源码并没有体现这一点，而是在对每一个八度处理中都是用相同的数组sig[]。首先明确一下sig数组内.存储的并不是一个绝对的模糊核，而是相对的模糊核，这一点很重要，既然是相对的模糊核，那么第一幅图像的核就很重要了，所以尺度的连续就看每个八度的第一幅图像了。
   对于以下列出的高斯金字塔的构建过程来看，每个八度中的第一幅图像并没有一个2倍的尺度跃进过程。但是，这个2倍的跃进式隐含在整个高斯金字塔的构建过程中了！
   再看倒数第三幅图像，这幅图像的尺度是2^(3/3) $\sigma$ ，3/3=1，也就是说，在这个八度中，第一幅图像的尺度是 $\sigma$ ，而倒数第三幅图像的尺度是2 $\sigma$ ，正好发生了一个2的跃进！这就是以这幅图像作为基准进行下采样的原因，如此的话，下一个八度的第一幅图像的初始尺度就是2* $\sigma$ 了。

这就是真相，这就是为什么选用倒数第三幅图像进行下采样的原因。

void SIFT::buildGaussianPyramid( const Mat& base, vector<Mat>& pyr, int nOctaves ) const  
{  
    vector<double> sig(nOctaveLayers + 3);  //
    pyr.resize(nOctaves*(nOctaveLayers + 3));  
    // precompute Gaussian sigmas using the following formula:  
    //  \sigma_{total}^2 = \sigma_{i}^2 + \sigma_{i-1}^2  
    sig[0] = sigma;  
    double k = pow( 2., 1. / nOctaveLayers );  
    for( int i = 1; i < nOctaveLayers + 3; i++ )  
    {  
        double sig_prev = pow(k, (double)(i-1))*sigma;  
        double sig_total = sig_prev*k;  
        sig[i] = std::sqrt(sig_total*sig_total - sig_prev*sig_prev);  
    }  
    for( int o = 0; o < nOctaves; o++ )  
    {  
        for( int i = 0; i < nOctaveLayers + 3; i++ )  
        {  
            Mat& dst = pyr[o*(nOctaveLayers + 3) + i];  
            if( o == 0  &&  i == 0 )  
                dst = base;  
            // base of new octave is halved image from end of previous octave  
            else if( i == 0 )/*每一个八度中第一幅图像的确定过程*/  
            {  
                  const Mat& src = pyr[(o-1)*(nOctaveLayers + 3) + nOctaveLayers];  
                  resize(src, dst, Size(src.cols/2, src.rows/2), 0, 0, INTER_NEAREST);  
            }   
           else  
           {  
                    const Mat& src = pyr[o*(nOctaveLayers + 3) + i-1];   
                    GaussianBlur(src, dst, Size(), sig[i], sig[i]);   
           }  
        }   
     }  
}  
void SIFT::buildDoGPyramid( const vector<Mat>& gpyr, vector<Mat>& dogpyr ) const  
{   
        int nOctaves = (int)gpyr.size()/(nOctaveLayers + 3);  
        dogpyr.resize( nOctaves*(nOctaveLayers + 2) );   
        for( int o = 0; o < nOctaves; o++ )  
        {   
               for( int i = 0; i < nOctaveLayers + 2; i++ )   
               {   
                     const Mat& src1 = gpyr[o*(nOctaveLayers + 3) + i];   
                     const Mat& src2 = gpyr[o*(nOctaveLayers + 3) + i + 1];   
                     Mat& dst = dogpyr[o*(nOctaveLayers + 2) + i];   
                     subtract(src2, src1, dst, noArray(), DataType<sift_wt>::type);   
               }  
        }  
}

你可能感兴趣的:(图像处理)

Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何学好图像处理——从小白到大神？ chentengkui 图像处理
如何学好图像处理——从小白到大神？标签：图像处理学习方法2016-02-2617:4818439人阅读评论(25)收藏举报分类：学习方法与方法论（13）版权声明：本文为博主原创文章，未经博主允许不得转载。什么是数字图像处理？历史、以及它所研究的内容。说起图像处理，你会想到什么？你是否真的了解这个领域所研究的内容。纵向来说，数字图像处理研究的历史相当悠久；横向来说，数字图像处理研究的话题相当广泛。数
多通道 ISP（双 ISP）并行处理机制解析：架构演进、资源调度与实战配置路径观熵影像技术全景图谱：架构调优与实战接口隔离原则架构影像 Camera
多通道ISP（双ISP）并行处理机制解析：架构演进、资源调度与实战配置路径关键词：双ISP、并行图像处理、多Sensor管线、分布式调度、ISP平衡调度、帧同步、多路输入、SoC图像架构摘要：随着智能手机多摄系统的普及，传统单通道ISP架构已无法满足同时驱动多颗高分辨率摄像头、并发处理视频与拍照任务的性能需求。为此，各大SoC厂商纷纷引入“双ISP”或“多通道ISP”设计，用于提升吞吐能力、降低延
Halcon试用与许可指南：2022年7月版我就是夏迎春
本文还有配套的精品资源，点击获取简介：本文件提供了Halcon软件的试用证书和许可证相关资料的集合，为潜在用户提供免费体验Halcon各项功能的途径，包括图像处理、形状匹配、OCR和条形码读取等。用户可以通过试用版全面了解软件功能，评估是否符合项目需求，并指导如何正确管理和优化许可证使用，以符合预算和需求。1.Halcon软件概述在当今高度自动化的工业时代，机器视觉系统发挥着至关重要的作用。Hal
专业图片背景移除工具开开心心_Every ocr 语音识别人工智能 excel symfony 启发式算法宽度优先
软件介绍本文介绍一款具有智能抠图功能的图像处理工具，帮助用户快速完成图片背景分离操作。软件特性这款抠图工具提供绿色汉化版本，无需安装即可直接运行，操作界面简洁直观。使用方法用户只需将需要处理的图片文件拖拽至软件界面，系统即可自动识别并完成抠图操作，无需复杂设置。离线功能该工具支持离线使用模式，用户无需连接互联网即可完成图片抠图处理，保障隐私安全。这款工具还有许多功能，我就不一一介绍啦。以下为软件获
《零基础入门AI：OpenCV图像预处理进一步学习》竹子_23 OpenCV入门 opencv 人工智能学习
本文全面讲解OpenCV图像预处理的七大核心技术（插值方法、边缘填充、图像矫正（透视变换）、图像掩膜、ROI切割、图像添加水印、图像噪点消除），每个知识点都配有详细解释和实用代码示例，帮助初学者建立系统的图像处理知识体系。一、插值方法：图像缩放的核心技术插值是在图像缩放或旋转时估算新像素值的方法，不同方法在速度和质量上有显著差异。1.最近邻插值原理：直接取最邻近像素的值特点：速度最快，但会产生锯齿
OpenCV基础02_图像预处理白槿_cha 计算机视觉基础 opencv 人工智能计算机视觉笔记
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学一、图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂
小白学视觉 | 在OpenCV中进行图像预处理双木的木深度学习拓展阅读人工智能机器学习深度学习 opencv 计算机视觉图像处理 ai
本文来源公众号“小白学视觉”，仅用于学术分享，侵权删，干货满满。原文链接：在OpenCV中进行图像预处理今天，我们进一步深入，并处理在图像处理中常用的形态学操作。形态学操作用于提取区域、边缘、形状等。什么是形态学操作？形态学操作是在二值图像上进行的。二值图像可能包含许多不完美之处。特别是由一些简单的阈值操作产生的二值图像（如果你对阈值不熟悉，现在不用担心）可能包含许多噪声和畸变。OpenCV库中提
机器视觉Halcon
介绍Halcon是由德国MVTecSoftwareGmbH公司开发的一款机器视觉软件，广泛应用于工业检测、医学成像、机器人引导、三维视觉等领域。它提供强大的图像处理和分析功能，支持快速开发高效的机器视觉应用。_____________________________________________________________________________Halcon主要特点1.强大的图像处理
显卡什么牌子的好？质量好性价比高？显卡品牌最好排名前十名？日常购物小技巧
今天我们就来说下：显卡什么牌子的好？质量好性价比高？显卡品牌最好排名前十名？大家好！我是花桃平台最大团队&联合创始人大同导师。相较于其它返利app，花桃佣金更高，模式更好，终端用户不流失！在如今的信息时代中，电脑已成为人们日常生活中必不可少的电子设备之一。而显卡作为电脑的核心零部件之一，是保障电脑图像处理、游戏运行等方面必不可少的硬件设备。在市场上，显卡品牌数不胜数，那么显卡什么牌子好呢？这是一个
LabVIEW图像处理与OCR综合实践咸鱼cc
本文还有配套的精品资源，点击获取简介：本压缩包“图像VI.zip”提供了与图像处理和OCR技术相关的LabVIEW子VI，涵盖了从摄像头获取图像到OCR处理的全套功能。LabVIEW是美国国家仪器公司开发的图形化编程工具，适用于数据采集、测量和控制应用。该课程将指导学生如何使用LabVIEW的“VisionAcquisition”库进行图像采集，并通过相关子VI实现连续或单帧图像的获取。同时，讲解
图像处理全栈指南：从传统算法到深度学习，再到FPGA移植阿牛的药铺图像算法区图像处理算法深度学习
图像处理全栈指南：从传统算法到深度学习，再到FPGA移植一、引言：图像处理是光学类产品的“大脑”光学类产品（可见光摄像头、红外热成像、光谱仪）的核心价值，在于将光信号转化为可理解的图像信息。而图像处理算法，就是解读这些信息的“大脑”——从传统的边缘检测到深度学习的目标识别，从实时降噪到高维光谱分割，每一步都决定了产品的性能（如分辨率、帧率、功耗）。对于算法移植工程师（科研助理1）岗位而言，需要掌握
opencv-day2-图像预处理1 谢眠 OpenCV opencv 计算机视觉
图像预处理在计算机视觉和图像处理领域，图像预处理能够提高后续处理（如特征提取、目标检测等）的准确性和效率。常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂直翻转或同时水平和垂直翻转。这个函数接受两个参数：要翻转的图像和一个指定翻
OpenCV学习探秘之二：数字图像的矩阵原理，OpenCV图像类与常用函数接口说明，及其常见操作核心技术详解牵牛老人 opencv专栏 opencv 学习矩阵
一、图像处理基础概念1.1数字图像的矩阵如下图，这是我们看到的Lena的头像，但是计算机看来，这副图像只是一堆亮度各异的点。一副尺寸为M×N的图像可以用一个M×N的矩阵来表示，矩阵元素的值表示这个位置上的像素的亮度，一般来说像素值越大表示该点越亮。一般来说，灰度图用2维矩阵表示；彩色（多通道）图像用3维矩阵（M×N×3）表示。对于图像显示来说，目前大部分设备都是用无符号8位整数（类型为CV_8U）
轻松实现图片去色的实用工具
本文还有配套的精品资源，点击获取简介：图片去色工具是一款专注于将彩色图片转换为黑白图片的软件，通过灰度化处理来增添艺术感或特殊效果。该工具采用简单步骤，支持批量处理，易于操作，且兼容多种图片格式及操作系统。本篇文章深入探讨了图片颜色模型、灰度图像生成、批量处理功能和软件的版本特点，以及使用说明和艺术效果的创造，为读者提供全面的去色工具应用指导。1.图片颜色模型（RGB模型）在数字图像处理中，颜色模
OpenCV图像预处理
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，以下是一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、
Day 17: 常见的聚类算法
聚类算法聚类算法是一种无监督学习技术，用于将数据集中的相似对象分组到不同的类别（称为“簇”）中，而不需要预先定义的标签。其核心目标是：同一簇内的数据点尽可能相似（高内聚性），不同簇之间的数据点尽可能不同（高分离性）。聚类广泛应用于数据挖掘、模式识别、图像处理等领域，如客户细分、文档分类或异常检测。聚类算法的基本原理聚类依赖于相似度度量（如欧氏距离）来评估数据点之间的接近程度。假设数据集包含nnn个
前端性能新纪元：Rust + WebAssembly 如何在浏览器中实现10倍性能提升（以视频处理为例）码力无边-OEC 前端 rust wasm web javascript
前端性能新纪元：Rust+WebAssembly如何在浏览器中实现10倍性能提升（以视频处理为例）JavaScript，作为Web开发的基石，是动态的、灵活的，但在性能上，它也存在着天生的“软肋”。对于那些计算密集型任务——如实时图像处理、视频编辑、3D渲染、复杂数据分析——纯JavaScript的执行效率往往会成为瓶颈，导致页面卡顿，用户体验直线下降。多年来，我们一直在寻找突破这层性能天花板的方
基于Matlab苹果质量检测及分级系统
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与意义随着现代农业的快速发展和消费者对食品品质要求的提高，苹果作为重要的水果品种，其质量检测与分级显得尤为重要。传统的苹果质量检测与分级方法依赖于人工操作，存在效率低下、主观性强、一致性差等问题。因此，本项目旨在利用Matlab编程环境，结合先进的图像处理技术和
MATLAB水果分级系统水果识别清风明月来几时图像算法处理 matlab 开发语言
MATLAB草莓识别系统是一个基于MATLAB的图像处理系统，用于识别和分类草莓图像。该系统可以帮助农业领域的研究人员和农民快速准确地识别草莓品种和成熟度，从而帮助决策种植、采摘和销售的工作。系统的主要功能包括：1.图像预处理：对草莓图像进行去噪、增强和标准化等预处理工作，以提高后续的图像分析和识别效果。2.特征提取：从预处理后的图像中提取代表草莓特征的信息，例如颜色、形状、纹理等。3.分类器训练
基于Matlab图像处理的水果分级系统 7zcode 图像处理开发 matlab 图像处理人工智能
本研究提出了一种基于图像处理技术的果实质量评估方法，旨在通过分析水果的颜色、形态特征和缺陷情况，自动化地对水果进行分级。通过使用MATLAB中的图像处理工具箱，首先将水果图像转换为HSV色彩空间，并提取色度信息，以计算水果的红色比率。随后，采用灰度转换、滤波和二值化处理来提取形态特征，并使用形态学操作评估水果的圆度和其他形状指标。此外，利用边缘检测技术分析水果表面的缺陷，进一步结合颜色和缺陷率来实
【OpenCV-Python】——图像处理基础&读写及显示图像&读写及播放视频&灰度图/彩色图/图像通道操作、运算柯宝最帅 OpenCV学习 python opencv 图像处理
目录前言：1、读并显示图像、写图像2、读并播放视频、写视频3、操作灰度图和彩色图、图像通道操作、运算总结：前言：在Python中，OpenCV使用NumPy数组存储图像，Numpy是使用Python进行数组计算的软件包，提供强大的N维数组对象，支持复杂的广播功能（数组运算），集成了C/C++和Fortran代码工具，支持线性代数、傅里叶变换和随机数等特性，还可作为通用数据的高效多维容器，如在Ope
图像处理——基于opencv和python（一）
一、实验环境配置1.1Python安装官网：https://www.python.org/downloads/下载任意3.6以上版本，如下载最新版本注意软件安装位置，注意勾选把路径，添加到系统变量。其它按推荐方式下一步。检查Python编译器是否正常安装。在CMD命令行中输入python,能够进入交互环境。或者在VSCode/Pycharm集成开发环境(IDE)能否检索到编译器。Writingto
opencv 裂缝_OpenCV——形态学 weixin_39738755 opencv 裂缝
前言继续学习图像里面的形态学知识——结构元、腐蚀、膨胀、开运算、闭运算、击中/不击中变换。以及部分基本形态学算法，包括边界提取、空洞填充、连通分量的提取、凸壳、细化、粗化、骨架、裁剪、形态学重建。其实就是对冈萨雷斯的《数字图像处理》中第9章节《形态学处理》的简要理解。如果你认为腐蚀是减小白色区域，膨胀是扩充白色区域，请务必看本博客，注意不同结构元的结果。参考博客：`OpenCV`官方的形态学运算文
python数字图像处理、色彩空间类型转换_Python+OpenCV图像处理—— 色彩空间转换... weixin_39653311 python数字图像处理色彩空间类型转换
一、色彩空间的转换代码如下：#色彩空间转换importcv2ascvdefcolor_space_demo(img):gray=cv.cvtColor(img,cv.COLOR_BGR2GRAY)#RGB转换为GRAY这里的GRAY是单通道的cv.imshow("gray",gray)hsv=cv.cvtColor(img,cv.COLOR_BGR2HSV)#RGB转换为HSVcv.imshow(
python图片处理入门 PyHaVolask python pillow 图像处理
内容基于Pillow库，涵盖从环境配置到高级合成、滤镜、绘制与验证码生成等各方面操作摘要本文系统地介绍了如何使用Python中最常用的图像处理库Pillow（PIL的升级版）进行从基础操作到高级合成和绘制的全方位图像处理，内容包括：环境配置与基本概念打开、查看、读取、保存与格式转换图像混合、遮罩与通道分离缩放、裁剪、旋转与镜像过滤器与数学合成（加减、乘除、反相等）亮度、色彩与对比度增强绘制基本图形
Python常用医疗AI库以及案例解析（场景化进阶版） Allen_Lyb python python 人工智能开发语言健康医疗
框架应用拓扑图用例MONAISimpleITKBiopythonscanpyPyTorchscikit-learnLLaVA-MedTransformersFHIRFastAPIFlowerPySyft医学图像处理生物信息学模型训练多模态分析数据交换隐私保护部署应用医学图像处理
深度盘点：那些超实用的 Mac 下载网站 fukai7722 macos
在Mac的使用过程中，丰富多样的软件能极大地提升我们的工作效率与娱乐体验。但从哪里获取可靠、安全且丰富的Mac软件呢？今天就给大家推荐并盘点一些实用的Mac下载网站。Mac青桔Macqj.com青桔堪称Mac用户的宝藏平台。它的资源库极为丰富，无论是日常办公所需的办公套件，还是进行创意工作的图像处理、视频剪辑软件，亦或是休闲娱乐的各类游戏，在这里都能找到。其优势在于，更新速度比较快。同时，网站的界
opencv学习（图像处理）
目录1.图像的截取2.颜色通道的提取3.图像边界填充4.数值计算（OpenCV图像数组的算术运算与OpenCV内置加法函数）5.图像融合（两个图像只有shape值相同才能融合）6.图像阈值（通过设定一个或多个阈值，将图像中的像素值划分为不同的类别（通常是黑白两个类别），从而简化图像信息，突出感兴趣的区域。）7.图像平滑（模糊，主动降低图像清晰度，目的是去除噪声、弱化细节）（1）均值滤波（2）方框滤
Camera图像处理原理及实例分析-重要图像概念 xw面朝大海图像处理
Camera图像处理原理及实例分析做为拍照手机的核心模块之一，camerasensor效果的调整，涉及到众多的参数，如果对基本的光学原理及sensor软/硬件对图像处理的原理能有深入的理解和把握的话，对我们的工作将会起到事半功倍的效果。否则，缺乏了理论的指导，只能是凭感觉和经验去碰，往往无法准确的把握问题的关键，不能掌握sensor调试的核心技术，无法根本的解决问题。1.1色彩感应及校正1.1.1
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他