python—SIFT、Harris的简单实现与地理标记图像匹配

一、SIFT算法原理

这里关于SIFT算法的描述是我参考网上的资料提了一些加上自己的理解来作为大概的描述，若是想更具体地了解SIFT的相关原理可以参考以下网址：https://www.cnblogs.com/wangguchangqing/p/4853263.html

1.概述

SIFT算法的主要思想是在尺度空间寻找极值点，然后对极值点进行过滤，找出稳定的特征点，最后在每个稳定的特征点周围提取图像的局部特性，形成局部描述子并将其用在以后的匹配中。SIFT 算法有以下几个主要步骤：
（1）尺度空间的极值检测。
（2）特征点定位。
（3）特征方向赋值。
（4）特征点描述。

2.构建尺度空间

尺度空间的主要思想是对原始图像进行尺度变换，并满足特征点的尺度不变性。
搜索所有尺度空间上的图像，通过高斯微分函数来识别潜在的对尺度和选择不变的兴趣点。学过数字图像处理应该知道，通过将图像与高斯函数做卷积运算能够对图像做相应程度的模糊，高斯卷积核是实现尺度变换的唯一线性核，所以一幅二维图像的尺度空间可定义为函数L(x,y,σ)，其中G(x,y,σ)为尺度可变高斯函数：

其中(x，y)为图像点的像素坐标，I(x，y)为该点数据。σ是高斯正态分布的方差，称为尺度空间因子，其反映了图像被平滑的程度，其值越小表征图像被平滑程度越小，相应尺度越小，通俗点说，方差越小，图像越清晰，细节部分便比较清楚，方差越大，则图像越模糊，体现的图像轮廓比较清楚。
为了有效地检测图像中一定尺度空间的稳定关键点，提出了利用尺度空间中DoG（Difference-of-Gaussian）极值作为判断依据，表达式为D(x,y,σ)，DoG算子定义为两个不同尺度的高斯核的差分，简单点理解就是将尺度空间看为一层一层的平面，相邻两层之间有一定的距离，这些距离便是差分，根据下面的构造图会更好地理解。设 k 为两相邻尺度空间的比例因子，则DoG算子定义如下：

D(x,y,σ)构造方式如下图所示：

3.检测DoG尺度空间极值点

极值点，顾名思义就是在一定的范围内最大或者最小的点，为了寻找尺度空间的极值点，每个像素点要和其同一尺度空间和相邻的尺度空间的所有相邻点进行比较，即和当前所在的那一层和相邻的两层上面的像素点做比较，当某一点大于或者小于所有相邻点时，该点就是极值点。
如下图所示，中间的检测点要和其所在图像的3×3邻域8个像素点，以及其相邻的上下两层的3×3领域18个像素点，共26个像素点进行比较，以确保在尺度空间和二维图像空间都能检测到局部极值。图中用红色圈出标记为叉号的像素若比相邻26个像素的DoG值都大或都小，则该点将作为一个局部极值点，记下它的位置和对应尺度。

4.删除不好的极值点

在上一步中算法搜索出了尺度空间的极值点，但并不是所有的极值点都可以作为合适的关键点，因为通过比较检测得到的DoG的局部极值点是在离散的空间搜索得到的，由于离散空间是对连续空间采样得到的结果，因此在离散空间找到的极值点不一定是真正意义上的极值点，因此要设法将不满足条件的点剔除掉。那么以下两种方法便是针对局部、尺度和主曲率比率与邻近像素进行详细比对，去除低对比度（敏感噪声）的关键点或不稳定的局部边缘响应点。

（1）剔除低对比度的特征点

设候选特征点为 x，其偏移量定义为 Δx，其对比度为D(x)的绝对值∣D(x)∣，对D(x)应用泰勒展开式：

由于x是D(x)的极值点，所以对上式求导并令其为0，得到：

然后再把求得的Δx代入到D(x)的泰勒展开式中

设对比度的阈值为 T，若∣D(x^)∣≥T，则该特征点保留，否则剔除掉。

（2）剔除不稳定的边缘响应点

在边缘梯度的方向上主曲率值比较大，而沿着边缘方向则主曲率值较小。候选特征点的DoG函数D(x)的主曲率与2×2Hessian矩阵H的特征值成正比

其中，Dxx,Dxy,Dyy是候选点邻域对应位置的差分求得的。
为了避免求具体的值，可以使用H特征值得比例。设α=λmax为H的最大特征值，β=λmin为H的最小特征值，则

其中，Tr(H)为矩阵H的迹，Det(H)为矩阵H的行列式。
设γ=αβ表示最大特征值和最小特征值的比值，则

上式的结果与两个特征值的比例有关，和具体的大小无关，当两个特征值想等时其值最小，并且随着γ的增大而增大。因此为了检测主曲率是否在某个阈值Tγ下，只需检测

如果上式成立，则剔除该特征点，否则保留。

5.确定特征点的主方向

特征点方向的计算方法为：统计关键点领域内的像素点方向，取大多数点的方向作为主方向。关键点领域内像素的梯模值与主方向的计算公式如下：

m(x,y)为每个点L(x,y)的梯度的模，θ(x,y)为方向。其实也可以通过直方图来筛选，直方图最高则代表概率最高，也就是被指向最多的一个方向。

5.生成特征描述

一个特征点描述符是在每个图像采样点周围区域中位置计算梯度大小和方向产生的。首先，在特征点周围位置对图像梯度大小进行采样，利用特征点的尺度选择图像高斯模糊水平。将坐标轴旋转为特征点的方向，以确保旋转不变性。对每个关键点使用4×4共16个种子点来描述，这样一个关键点就可以产生128维的SIFT特征向量。

二、SIFT特征匹配

1.SIFT特征提取

在《python计算机视觉编程》这本书中，作者采用了开源工具包VLfeat，因为用Python重新实现SIFT特征提取的全过程不会很高效，而且也超出了这本书的范围，虽然VLfeat这个库是用C语言写的，不过我们可以利用它的命令行接口来使用。VLfeat的安装在上一篇博客中已经介绍过，这里给出VLfeat官网地址：http://www.vlfeat.org/download.html

（1）在这里，我使用了集美大学的部分场景图片来进行基于SIFT算法的特征匹配，下面给出代码：

from PIL import Image
from pylab import *
import sys
from PCV.localdescriptors import sift


if len(sys.argv) >= 3:
  im1f, im2f = sys.argv[1], sys.argv[2]
else:
#  im1f = '../data/sf_view1.jpg'
#  im2f = '../data/sf_view2.jpg'
  im1f = 'image/24.jpg'
  im2f = 'image/25.jpg'
#  im1f = '../data/climbing_1_small.jpg'
#  im2f = '../data/climbing_2_small.jpg'
im1 = array(Image.open(im1f))
im2 = array(Image.open(im2f))

sift.process_image(im1f, 'out_sift_1.txt')
l1, d1 = sift.read_features_from_file('out_sift_1.txt')
figure()
gray()
subplot(121)
sift.plot_features(im1, l1, circle=False)

sift.process_image(im2f, 'out_sift_2.txt')
l2, d2 = sift.read_features_from_file('out_sift_2.txt')
subplot(122)
sift.plot_features(im2, l2, circle=False)

#matches = sift.match(d1, d2)
matches = sift.match_twosided(d1, d2)
print '{} matches'.format(len(matches.nonzero()[0]))

figure()
gray()
sift.plot_matches(im1, im2, l1, l2, matches, show_below=True)
show()

（2）运行结果
这里采用集美大学的部分场景图作为测试，原图如下：

运行前有一点需要大家注意，我们所匹配的两张图片它们的格式大小是经过软件修改成为一样大的，如果两张图片尺寸不一那么就会出现报错，若是图片太大，那么运行就会很慢。

运行过程：

①在代码运行时出现了这么一个错误：No such file or directory: 'empire.sift'，报错提示问题出现在sift.py这个文件中，我便仔细看了一下并重新核对了安装过程，发现是在修改sift.py文件时路径后少了一个空格，补上就可以解决，若是读者也遇到类似的问题，可以去检查检查自己的代码是否有遗漏。

②解决了上面这个问题后，代码出现了新的报错，如下图：

数组越界的意思，我在网上查阅了资料，发现大多数都是说数据集和矩阵的问题，但是并没有找到合适的修改代码的方法，而后发现可能是因为VLfeat版本的问题，我的系统中使用的是VLfeat 0.9.21的版本，官网现在的版本便是这个，但是我们所使用的代码是从2014年出版的《python计算机视觉编程》这本书中得到的，译者当时使用的是VLfeat 0.9.17版本，所以使用现在的版本可能会有一些差异，所以我便在重新选择VLfeat 0.9.20版本进行安装，这里给出下载地址：https://github.com/houhongyi/vlfeat-0.9.20 ，大家也可以去官网上下载。

根据上一篇博客的介绍，安装完成后，代码便可以成功运行了，运行结果如下：

2.与Harris角点匹配作对比

（1）Harris角点检测代码

# -*- coding: utf-8 -*-
from pylab import *
from PIL import Image

from PCV.localdescriptors import harris
from PCV.tools.imtools import imresize

im1 = array(Image.open("image/1.jpg").convert("L"))
im2 = array(Image.open("image/7.jpg").convert("L"))

# resize加快匹配速度
im1 = imresize(im1, (im1.shape[1]/2, im1.shape[0]/2))
im2 = imresize(im2, (im2.shape[1]/2, im2.shape[0]/2))

wid = 5
harrisim = harris.compute_harris_response(im1, 5)
filtered_coords1 = harris.get_harris_points(harrisim, wid+1)
d1 = harris.get_descriptors(im1, filtered_coords1, wid)

harrisim = harris.compute_harris_response(im2, 5)
filtered_coords2 = harris.get_harris_points(harrisim, wid+1)
d2 = harris.get_descriptors(im2, filtered_coords2, wid)

print 'starting matching'
matches = harris.match_twosided(d1, d2)

figure()
gray() 
harris.plot_matches(im1, im2, filtered_coords1, filtered_coords2, matches)
show()

（2）运行结果

可以看到，Harris角点检测匹配的精确度比SIFT特征匹配的精确度低了许多，在运行速度上也较慢。同时，我还选取了对称性的建筑图像进行了测试，发现不管是使用SIFT还是Harris，对于这类相似性大的图像，特征点提取并不能很好地识别，所以在匹配时出现了如下左跟右相匹配的情况。

三、地理位置标记

在此之前，我们需要安装pydot工具包，这里给出简单的安装教程：

1、命令行输入pip install graphviz

2、到网址 http://www.graphviz.org/download/ 下载graphviz-2.38.msi文件，进行安装，安装完成后将其bin目录添加到系统的环境变量Path中去。

3.命令行输入pip install pydot，一开始会出现报错，窗口会提示你应该先更新你的pip，尝试输入python -m pip install --upgrade pip。在这里我安装的是新版本，也有人安装pydot 1.1.0版本，可以参考 https://blog.csdn.net/lyy14011305/article/details/57422512?utm_source=blogxgwz8。

1.在这里先给出代码：

# -*- coding: utf-8 -*-
from PIL import Image
from pylab import *
from numpy import *
import os
import pydot
from PCV.localdescriptors import sift

def get_imlist(path):
    return [os.path.join(path,f) for f in os.listdir(path) if f.endswith('.jpg')]


# pydot需要绝对路径，路径分隔符为/而非\
download_path = "D:/pythonCode/image"
path = "D:/pythonCode/image/"

# list of downloaded filenames
imlist = get_imlist(download_path)
nbr_images = len(imlist)

# extract features
featlist = [imname[:-3] + 'sift' for imname in imlist]
for i, imname in enumerate(imlist):
    sift.process_image(imname, featlist[i])



matchscores = zeros((nbr_images, nbr_images))

for i in range(nbr_images):
    for j in range(i, nbr_images): #only compute upper triangle
        print 'comparing ', imlist[i], imlist[j]
        l1, d1 = sift.read_features_from_file(featlist[i])
        l2, d2 = sift.read_features_from_file(featlist[j])
        matches = sift.match_twosided(d1, d2)
        nbr_matches = sum(matches>0)
        print 'number of matches = ', nbr_matches
        matchscores[i,j] = nbr_matches
print "The match scores is: \n", matchscores

# copy values
for i in range(nbr_images):
    for j in range(i + 1, nbr_images): # no need to copy diagonal
        matchscores[j, i] = matchscores[i, j]

# 可视化
threshold = 2 # min number of matches needed to craete link

g = pydot.Dot(graph_type='graph') # don't want the default directed graph

for i in range(nbr_images):
    for j in range(i+1, nbr_images):
        if matchscores[i,j] > threshold:
            #图像对中的第一幅图像
            im = Image.open(imlist[i])
            im.thumbnail((100,100))
            filename = path + str(i) + '.png'
            im.save(filename) #需要一定大小的临时文件
            g.add_node(pydot.Node(str(i), fontcolor='transparent',
                       shape='rectangle', image=filename))

            #图像对中的第二幅图像
            im = Image.open(imlist[j])
            im.thumbnail((100,100))
            filename = path + str(j) + '.png'
            im.save(filename) #需要一定大小的临时文件
            g.add_node(pydot.Node(str(j), fontcolor='transparent',
                       shape='rectangle', image=filename))
            g.add_edge(pydot.Edge(str(i), str(j)))
g.write_png('jmu.png')

这段代码先将文件夹中的图片根据sift描述子算法生成.sift文件，这里有一点要注意，给图片命名的时候千万不要加空格！否则会无法生成.sift文件而报错，往往因为忽视一个小细节会耗费大部分时间去查错。在可视化连接部分，根据所给链接的步骤进行安装，注意顺序以及版本问题，在安装pydot时，我使用pip install pydot命令，安装最新的版本，若是安装pydot1.1.0版本可能会有不适用的问题，还需要再调整，若是能安装成功可单独测试可视化连接部分，一般没什么大问题。

2.运行结果

同样的，我选用了集美大学的场景作为测试图，以下为15张的运行结果，因为计算量大所以运行速度偏慢，若是有读者试运行则需要耐心等待。

以上便是根据拍摄的图像进行分类后的结果，可以看到从上面五张图依次是中山纪念馆，嘉庚图书馆前，尚大楼远景，万人食堂，月明楼，这五个场景的分类匹配率为100%。

OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
什么是特征检测和描述，OpenCV中常见的特征检测算法有哪些？ -Max-静- #opencv学习 opencv 算法人工智能
特征检测和描述是计算机视觉中的基本概念，它们在图像识别、对象跟踪、图像拼接等多种任务中发挥着至关重要的作用。特征检测是指识别图像中重要的特定点、区域或结构，这些特征通常具有独特性、可重复性以及对光照变化、旋转和比例变换等变化的鲁棒性。这些特征点可以用作进一步分析的参考。特征描述是基于一定的几何或者颜色信息生成特征点的特征描述符，这种描述应满足欧式空间的仿射不变性和噪声鲁棒性，并且不同特征点的特征描
opendronemap集群搭建 Robber2000 云计算容器运维云原生
需求OpenDroneMap（ODM）是一个开源项目，旨在利用无人机采集的图像数据生成地图、模型和其他地理空间数据。它主要解决以下问题：航空摄影数据处理：ODM可以处理无人机拍摄的大量航空图像数据，通过图像处理和计算机视觉技术生成高质量的地图和模型。地图制作与更新：利用ODM，用户可以快速、成本效益地生成地图，并及时更新地理空间数据，有助于城市规划、灾害监测等领域的应用。三维建模：ODM可以生成精
Canny详解 kxg916361108 计算机视觉图像处理人工智能
Canny边缘检测是一种经典的图像处理技术，被广泛应用于计算机视觉和图像处理领域。它由JohnF.Canny在1986年提出，是一种多阶段的边缘检测算法，具有高精度和低错误率的特点。Canny边缘检测的步骤：高斯滤波（GaussianBlur）：Canny边缘检测首先对图像进行高斯平滑处理，以减少图像中的噪声。高斯滤波器将图像中的每个像素与周围像素进行加权平均，从而模糊图像并减少噪声。计算图像梯度
MATLAB图像拼接算法及实现程序员小溪算法 matlab 计算机视觉 MATLAB 人工智能
图像拼接算法及实现（一）论文关键词：图像拼接图像配准图像融合全景图论文摘要：图像拼接(imagemosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。一般来说,图像拼接的过程由图像获取,图像配准,图像
AI图像识别算法助力安全生产*提升风险监测效率---豌豆云豌豆云人工智能安全
2024年开年来安全生产事故频发，工厂爆炸、工程坍陷等重大安全生产事故的发生再次为我们敲响了警钟。安全生产是企业发展的生命线，而传统的安全监测手段存在盲区和延迟，难以及时发现和应对潜在风险。AI图像识别算法通过利用先进的计算机视觉和深度学习技术，能够有效提高风险监测效率，保障企业的安全生产。AI图像识别算法助力安全生产AI图像识别算法通常部署在本地服务器或边缘服务器，通过分析前端监控摄像头、无人机
深入了解OpenCVSharp中常见的图像处理功能仰望大佬007 图像处理 opencv 计算机视觉 c#
深入了解OpenCVSharp中常见的图像处理功能前言1.图像加载与保存2.图像基本操作3.图像滤波4.边缘检测5.图像分割6.特征检测与描述子7.目标识别与跟踪8.图像融合与拼接9.形状匹配与模板匹配10.颜色空间转换与直方图11.图像转换与绘制12.图像分类与机器学习13.高级图像处理算法14.GPU加速与并行计算前言OpenCVSharp是C#语言中用于图像处理和计算机视觉的开源库，它提供了
【计算机视觉面经四】基于深度学习的目标检测算法面试必备（RCNN~YOLOv5）旅途中的宽~ 计算机视觉面经总结计算机视觉深度学习目标检测 YOLO RCNN
文章目录一、前言二、两阶段目标检测算法2.1RCNN2.2Fast-RCNN2.3FasterR-CNN三、多阶段目标检测算法3.1CascadeR-CNN四、单阶段目标检测算法4.1编码方式4.1.1基于中心坐标4.1.1.1方案14.1.1.2方案24.1.1.3方案34.2YOLOv14.3SSD4.4YOLOv24.5RetinaNet4.6YOLOv34.7YOLOv44.8YOLOv5
OpenCV：开源计算机视觉的魔力之门 mikes zhang 计算机视觉
在当今这个信息爆炸的时代，图像和视频已经成为我们获取和传递信息的主要方式之一。从社交媒体上的照片分享，到安防监控、自动驾驶等领域的图像识别与处理，计算机视觉技术正日益改变着我们的生活。而在这场技术革命中，OpenCV（OpenSourceComputerVisionLibrary）这一开源计算机视觉库扮演着举足轻重的角色。本文将带你走进OpenCV的世界，一探其究竟。一、OpenCV简介OpenC
情感计算 - 情感模型无脑敲代码，bug漫天飞情感计算人工智能
1基本情感论模型--离散状态1Tomkins面部表情惩罚或奖励的反馈结果八类：基本情感2Izard具有动机的特征10中基本情感状态（言语内容表情等）神经系统电化学自主，遗传决定情感面部姿势活动情感活动输出决定脑区的反馈信息情感活动输出产生3Ekman美国心理学家早期的情感模型都是他提出的面部表情中应用广泛1972年六类情感状态90年代扩充更多的维度对于计算机视觉研究起到了推动作用泛文化意义历史进化
深度学习的进展 CuiXg 深度学习人工智能
深度学习的进展深度学习作为人工智能领域的重要分支之一，利用神经网络模拟人类大脑的学习过程，通过数据训练模型以自动提取特征、识别模式、进行分类和预测等任务。近年来，深度学习在多个领域取得显著进展，尤其在自然语言处理、计算机视觉、语音识别和机器翻译等方面实现了突破性进展。方向一：深度学习的基本原理和算法深度学习基于神经网络概念，涉及反向传播、卷积神经网络、循环神经网络等算法。这些算法模拟人脑神经元间的
05基于卷积神经网络-支持向量机（自动寻优）CNN-SVM数据分类算法机器不会学习CSJ cnn 支持向量机分类人工智能
CNN原理卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛用于计算机视觉领域。CNN的核心思想是通过卷积层和池化层来自动提取图像中的特征，从而实现对图像的高效处理和识别。在传统的机器学习方法中，图像特征的提取通常需要手工设计的特征提取器，如SIFT、HOG等。而CNN则可以自动从数据中学习到特征表示。这是因为CNN模型的卷积层使用了一系列的卷积核
【机器学习案例7】计算机视觉中的小物体检测：基于补丁的方法 suoge223 机器学习实用指南机器学习计算机视觉人工智能
专栏导读作者简介：工学博士，高级工程师，专注于工业软件算法研究本文已收录于专栏：《机器学习实用指南》本专栏旨在提供1.机器学习经典案例及源码；2.开源机器学习训练数据集；3.机器学习前沿专业博文。以案例的形式从实用的角度出发，快速上手机器学习项目，在案例中成长，摆脱按部就班填鸭式教学。欢迎订阅专栏，订阅用户可私聊进入机器学习交流群（知识交流、问题解答），并获赠丰厚的机器学习相关学习资料（教材、源码
图像预处理技术与算法木子n1 算法嵌入式开发算法数码相机计算机视觉
图像预处理是计算机视觉和图像处理中非常关键的第一步，其目的是为了提高后续算法对原始图像的识别、分析和理解能力。以下是一些主要的图像预处理技术：1.图像增强：对比度调整：通过直方图均衡化（HistogramEqualization）等方法改善图像整体或局部的对比度。伽玛校正：改变图像的亮度特性，用于补偿显示器或其他硬件设备的非线性响应。锐化处理：如使用高通滤波器（如拉普拉斯算子、Sobel边缘检测算
Vis-TOP：视觉Transformer叠加处理器离欢论文 Transformer 人工智能机器学习 transformer 深度学习计算机视觉
摘要近年来，Transformer[23]在自然语言处理(NLP)领域取得了良好的效果，并开始向计算机视觉(CV)领域拓展。优秀的型号如VisionTransformer[5]和SwinTransformer[17]已经出现。同时，Transformer模型平台扩展到嵌入式设备，以满足一些对资源敏感的应用场景。但是，由于Transformer模型参数多、计算流程复杂、结构变体繁多，在硬件设计中存在
【Transformer养猪】Livestock Monitoring with Transformer 离欢 Transformer 论文笔记 python 人工智能
对牲畜行为的跟踪有助于在现代动物饲养场及早发现并预防传染病。除了经济收益，这将减少畜牧业中使用的抗生素数量，否则这些抗生素将进入人类的饮食，加剧抗生素耐药性的流行，这是导致死亡的主要原因。我们可以使用大多数现代农场都有的标准摄像机来监控牲畜。然而，大多数计算机视觉算法在这项任务中表现不佳，主要原因是:(i)农场饲养的动物看起来相同，缺乏任何明显的空间特征，(ii)现有的跟踪器都不能长时间保持健壮，
【EI会议征稿通知】2024年第四届计算机视觉与模式分析国际学术大会（ICCPA 2024）搞科研的小刘选手学术会议人工智能自动化能源大数据云计算
2024年第四届计算机视觉与模式分析国际学术大会（ICCPA2024）20244thInternationalConferenceonComputerVisionandPatternAnalysis(ICCPA2024)第四届计算机视觉与模式分析国际会议（ICCPA2024）将于2024年5月17日至19日在中国鞍山召开。ICCPA2024汇集了来自世界各地的计算机视觉与模式分析领域的学者、研究人
计算机视觉学习指南（划分为20个大类） superdont 计算机视觉入门计算机视觉人工智能开发语言 python opencv
计算机视觉的知识领域广泛而庞杂，涵盖了众多重要的方向和技术。为了更好地组织这些知识，我们需要遵循无交叉无重复（MutuallyExclusiveCollectivelyExhaustive，MECE）的原则，并采用循序渐进的方式进行分类和划分。按照无交叉无重复的原则，我们将计算机视觉划分为20个重要的方向，每个方向都具有明确的定义和特定的应用领域。通过这种划分方式，可以确保每个方向都在整个计算机视
计算机视觉与图像处理面试题,深度学习图像处理算法工程师面试题 ZW9 计算机视觉与图像处理面试题
AI开发平台ModelArtsModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。按需/包周期付费可选，最低0.00元/小时引入MoXingFramework模块||https://support.huaweicloud
互联网加竞赛基于计算机视觉的身份证识别系统 Mr.D学长 python java
0前言优质竞赛项目系列，今天要分享的是基于机器视觉的身份证识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1实现方法1.1原理1.1.1字符定位在Android移动端摄像头拍摄的图片是彩色图像，上传到服务器后为了读取到身份证上的主要信息，就要去除其他无关的元素，因此对身份证图
【Python】图像裁剪与匹配林九生 Python python opencv 开发语言
图像裁剪与匹配在计算机视觉领域，图像处理是一项关键的任务，其中图像裁剪和匹配是常见的操作之一。本文将介绍如何使用OpenCV库进行图像裁剪与匹配，并展示一个简单的示例代码。1.引言在图像处理中，有时需要从一张大图中截取特定区域，并在另一张图中寻找相似的部分。这可以通过裁剪和匹配操作来实现。本文将演示如何使用Python和OpenCV库进行这些操作。2.代码示例以下是一个使用OpenCV库的简单代码
深度学习——概念引入韶光流年都束之高阁深度学习日记深度学习人工智能职场和发展
深度学习深度学习简介深度学习分类根据网络结构划分：循环神经网络卷积神经网络根据学习方式划分：监督学习无监督学习半监督学习根据应用领域划分：计算机视觉自然语言处理语音识别生物信息学深度学习简介深度学习（DeepLearning，DL）是机器学习领域中的一个新的研究方向，主要是通过学习样本数据的内在规律和表示层次，让机器能够具有类似于人类的分析学习能力。深度学习的最终目标是让机器能够识别和解释各种数据
行人重识别 NineDays66 人工智能
在人的感知系统所获得的信息中，视觉信息大约占到80%～85%。行人重识别（personre-identification）是近几年智能视频分析领域兴起的一项新技术，属于在复杂视频环境下的图像处理和分析范畴，是许多监控和安防应用中的主要任务，并且在计算机视觉领域获得了越来越多的关注。下面我们就仔细来聊聊行人重识别(ReID)。1.什么是行人重识别行人重识别（PersonRe-identificat
用 Python 制作一款炫酷的二维码！ Python数据之道可视化 python 数据可视化 opencv svg
来源：https://blog.csdn.net/jinyj1转自：深度学习算法与计算机视觉1.导入myqr库下载myqr库使用windows+R键，输入cmd调出命令窗口在黑框里输入(在python3环境下，python2不行)pip install myqr等到提示下载成功就可以了导入myqr库因为我是用pycharm的，所以还需要在pycharm中导入myqr打开pycharm的file-s
【保姆级教程|YOLOv8改进】【7】多尺度空洞注意力（MSDA），DilateFormer实现暴力涨点阿_旭 YOLOv8网络结构改进 YOLO YOLOv8改进 MSDA
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【6】快速涨点，SPD-Conv助力低分辨率与小目标检测阿_旭 YOLOv8网络结构改进 YOLO 目标检测人工智能 YOLOv8改进
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪阿_旭深度学习实战 AI应用软件开发实战计算机视觉 python 行人车辆追踪目标追踪 YOLOv8 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络阿_旭 YOLOv8网络结构改进 YOLO YOLOv8改进 FasterNet 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的100种中草药智能识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python YOLOv8 中草药识别深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

python—SIFT、Harris的简单实现与地理标记图像匹配

一、SIFT算法原理

二、SIFT特征匹配

三、地理位置标记

你可能感兴趣的:(计算机视觉)