Hello.Reader

SIFT 全面解析：原理、实现与应用

1. 引言

1.1 什么是 SIFT？

SIFT，全称为 Scale-Invariant Feature Transform（尺度不变特征变换），是一种用于图像特征检测和描述的经典算法。它通过提取图像中的局部关键点，并为每个关键点生成具有尺度和旋转不变性的描述子，使其能够在不同的图像中进行特征匹配。SIFT 算法尤其适合处理视角变化、尺度变换、部分遮挡和光照变化的问题，因此被广泛应用于计算机视觉领域。

1.2 SIFT 的发展历程

SIFT 由计算机科学家 David G. Lowe 于 1999 年首次提出，并在 2004 年发表的论文《Distinctive Image Features from Scale-Invariant Keypoints》中进一步完善。其革命性的设计使得 SIFT 成为了特征提取领域的重要里程碑。
虽然 SIFT 曾因专利保护限制了开源使用，但随着专利过期（美国专利于 2020 年到期），SIFT 再次成为开源社区的重要工具，并在许多实际项目中被广泛应用。

此外，SIFT 的思想也启发了许多后续算法的诞生，例如 SURF（Speeded-Up Robust Features）和 ORB（Oriented FAST and Rotated BRIEF），进一步推动了特征提取技术的发展。

1.3 SIFT 的应用场景

由于其优越的性能和鲁棒性，SIFT 被广泛应用于以下领域：

图像拼接：通过匹配多个图像的特征点，生成全景图。
目标检测与识别：识别特定物体或场景。
三维重建：利用多个视角的图像，重建三维模型。
机器人导航：提取环境特征点，帮助机器人进行定位与路径规划。
视频跟踪与检索：识别和跟踪视频中的物体。

无论是学术研究还是工业实践，SIFT 都是一种极具价值的工具。

2. SIFT 的基本原理

SIFT 的核心目标是从图像中提取具有尺度、旋转不变性的局部特征点及其描述子，并利用这些特征实现图像匹配。以下是 SIFT 算法的主要步骤：

2.1 高斯尺度空间的构建

SIFT 的第一个核心步骤是构建高斯尺度空间，以检测图像中的关键点，使其对尺度变化具有不变性。

高斯平滑：高斯滤波器可去除图像的高频噪声，通过公式定义高斯滤波器：
$\sigma) = \frac{1}{2\pi\sigma^2} e^{-\frac{x^2 + y^2}{2\sigma^2}}$
其中， $(\sigma)$ 是尺度参数。
尺度空间的定义：在不同的尺度下对图像进行高斯滤波，形成一系列高斯模糊图像。
高斯差分 (DoG)：通过相邻尺度的高斯模糊图像相减，近似计算拉普拉斯算子：
$\sigma) = G(x, y, k\sigma) - G(x, y, \sigma)$
这里 $(k)$ 是尺度变化因子，通常取 $(k=\sqrt{2})$ 。
结果：生成一组高斯差分金字塔（DoG 金字塔），为关键点检测提供基础。

2.2 关键点的检测与定位

在高斯差分金字塔中，检测图像的局部极值点，作为潜在关键点。

局部极值检测：对每个像素点，与其在空间（当前图像）和尺度（上下相邻尺度）内的 26 个邻域像素比较，判断是否为极大值或极小值。
关键点定位：
- 使用泰勒展开式对关键点的精确位置进行拟合。
- 计算关键点的对比度，去除低对比度点。
- 通过分析二阶偏导数矩阵（Hessian 矩阵）的特征值，移除边缘响应点。

2.3 主方向分配

为了使特征点对旋转变化具有不变性，SIFT 为每个关键点分配主方向。

计算梯度方向：
- 在关键点的邻域内，计算每个像素的梯度幅值和方向：
  $\sqrt{(L(x+1, y) - L(x-1, y))^2 + (L(x, y+1) - L(x, y-1))^2}$
  $\theta(x, y) = \arctan{\frac{L(x, y+1) - L(x, y-1)}{L(x+1, y) - L(x-1, y)}}$
方向直方图：统计邻域内像素的梯度方向，构造方向直方图（通常分为 36 个方向），取直方图的主峰作为关键点的主方向。
副方向分配：如果直方图中有其他方向的峰值接近主方向，则为关键点分配多个方向，增强匹配鲁棒性。

2.4 特征描述子的生成

为每个关键点生成一个描述子，描述其周围邻域的梯度分布特征。

关键点对齐：以关键点的主方向为基准，将邻域旋转到统一方向，确保描述子的旋转不变性。
划分子区域：
- 将关键点邻域（通常为 $16 \times 16)$ ）划分为 $\times 4)$ 的网格。
- 在每个子网格内，统计梯度方向直方图，通常分为 8 个方向。
生成描述子：
- 每个子网格有 8 个方向，共 $\times 4 \times 8 = 128)$ 维特征向量。
- 为增强鲁棒性，归一化特征向量，并截断大于 0.2 的值，再次归一化。

2.5 特征匹配的流程

提取关键点后，SIFT 的最后一步是特征匹配，用于不同图像之间的关联。

欧氏距离匹配：通过计算两个特征点描述子之间的欧氏距离，确定匹配关系。
最近邻与次近邻比值：使用最近邻和次近邻的距离比值筛选匹配点，通常设定比值阈值（如 0.75），以剔除错误匹配。
RANSAC 算法优化：在匹配点中使用 RANSAC 方法，剔除误匹配点，提高匹配的可靠性。

3. SIFT 的算法实现细节

SIFT 算法的实现涉及多个核心步骤，每个步骤均通过细致的计算来保证特征点的鲁棒性和不变性。以下是各部分的详细解析：

3.1 高斯金字塔与 DoG（高斯差分）计算

高斯金字塔

将输入图像逐步降采样（如尺寸缩小为原来的 (1/2)）生成不同的分辨率层级（octaves）。
在每个层级中，通过改变高斯滤波器的尺度参数 (\sigma)，生成多个高斯模糊图像。

公式：
$\sigma) = G(x, y, \sigma) * I(x, y)$
其中：

$\sigma))$ 是高斯核。
$(I (x, y))$ 是输入图像。
$(*)$ 表示卷积操作。

高斯差分 (DoG)

通过高斯模糊图像的相邻层相减，计算高斯差分：
$\sigma) = L(x, y, k\sigma) - L(x, y, \sigma)$
DoG 近似拉普拉斯算子，用于高效检测图像中的边缘和角点。

实现细节

为减少边界效应，在图像边缘添加零填充。
通常每个层级有 3-5 个尺度 $(\sigma)$ ，形成 DoG 金字塔。

3.2 关键点的极值检测

步骤

对每个像素点，寻找其在 3D 空间中的极值：
- 比较当前像素点与其所在尺度层及上下相邻层的 26 个邻域像素。
- 若当前像素是极大值或极小值，则标记为潜在关键点。
多尺度空间中寻找局部极值使关键点具有尺度不变性。

实现细节

为避免计算复杂度过高，通常使用优化的邻域搜索算法。
使用插值提高极值点的定位精度。

3.3 消除边缘响应与低对比度点

低对比度点剔除：
- 通过计算像素点的对比度值 (D(x)) 是否低于阈值（如 0.03）来剔除弱响应点。
- 对比度值计算公式：
  $\frac{\partial D}{\partial x}^T x + \frac{1}{2} x^T \frac{\partial^2 D}{\partial x^2} x$
边缘响应剔除：
- 通过分析 DoG 的 Hessian 矩阵特征值，判断是否为边缘响应。
- 若主曲率的比值超过一定阈值（如 10:1），则剔除该点。

实现细节

高效计算梯度和 Hessian 矩阵。
选择适当的对比度和边缘响应阈值，确保平衡精度与性能。

3.4 梯度方向直方图的计算

步骤

梯度计算：
- 在关键点邻域中，计算每个像素的梯度幅值和方向：
  $\sqrt{(L(x+1, y) - L(x-1, y))^2 + (L(x, y+1) - L(x, y-1))^2}$
  $\theta(x, y) = \arctan{\frac{L(x, y+1) - L(x, y-1)}{L(x+1, y) - L(x-1, y)}}$
方向直方图：
- 将邻域划分为若干子区域（通常是 $16 \times 16)$ ）。
- 每个子区域的梯度方向分为 36 个方向（每 10° 一个桶）。
- 梯度幅值加权累加到对应的方向桶。
主方向分配：
- 找到梯度方向直方图中的主方向（直方图最高峰值对应的方向）。
- 若有多个次高方向与主方向接近，也可分配多个方向。

3.5 生成旋转不变的特征描述子

关键点对齐：以关键点的主方向为基准，对邻域进行旋转对齐。
描述子生成：
- 将邻域划分为 $\times 4)$ 的网格。
- 每个网格统计 8 个方向的梯度幅值，生成一个 $\times 4 \times 8 = 128)$ 维的特征向量。
归一化处理：
- 对特征向量进行 L2 范数归一化，增强光照鲁棒性。
- 截断大于 0.2 的值并再次归一化，抑制特征值异常点。

3.6 匹配方法与优化（如 k-d 树、FLANN）

特征匹配的基本方法

欧氏距离匹配：计算两个特征描述子之间的欧氏距离，选择最近的特征点作为匹配点。
最近邻比值筛选：
- 计算最近邻和次近邻的距离比值。
- 若比值小于设定阈值（如 0.75），保留该匹配。

匹配加速方法

k-d 树：利用 k-d 树进行快速最近邻搜索，减少匹配点的查找时间复杂度。
FLANN（Fast Library for Approximate Nearest Neighbors）：
- 一种快速近似最近邻算法库，支持大规模特征点匹配。
- 在 SIFT 中广泛使用，提供高效和准确的匹配结果。

误匹配剔除

使用 RANSAC 算法：
- 通过随机采样，估计匹配点之间的变换矩阵（如单应矩阵）。
- 剔除不符合变换模型的误匹配点。

4. SIFT 的优缺点分析

SIFT 算法作为计算机视觉领域的经典方法，因其出色的性能广泛应用于图像特征提取任务。以下从优点和缺点两个方面对 SIFT 进行全面分析。

4.1 SIFT 的优点

1. 尺度与旋转不变性

尺度不变性：通过构建高斯尺度空间和检测极值点，SIFT 实现了对不同尺度图像的特征点提取。例如，无论物体在图像中放大还是缩小，SIFT 都能检测到相同的关键点。
旋转不变性：通过为每个关键点分配主方向，并对其描述子进行旋转对齐，SIFT 保证了特征点在旋转变化下仍能保持一致性。

2. 鲁棒性强

部分遮挡：SIFT 的局部特征点描述方法，使其在图像部分遮挡的情况下，仍能匹配未被遮挡的部分。
噪声鲁棒性：由于高斯模糊的预处理步骤，SIFT 对高频噪声具有一定的抵抗能力。
小幅光照变化：通过对梯度归一化和特征描述子归一化，SIFT 能适应一定范围的光照变化。

3. 高描述能力

128 维特征描述子：SIFT 的特征描述子详细描述了关键点邻域的梯度分布，使其具有很高的区分能力。
多方向关键点分配：每个关键点可以分配多个方向，从而提升对复杂场景的描述能力。

4.2 SIFT 的缺点

1. 计算复杂度高

多尺度构建：需要对图像构建高斯金字塔，计算多层高斯模糊和差分。
关键点检测与优化：检测极值点、剔除边缘响应点以及对梯度方向分配均涉及大量计算。
特征描述子生成：128 维描述子的计算、归一化及特征匹配均需较高的计算资源。

时间复杂度：典型 SIFT 实现的时间复杂度为 (O(N \log N))，其中 (N) 是图像中的像素点数。

空间复杂度：需要存储高斯金字塔、DoG 图像及特征描述子，内存占用较高。

2. 对仿射变换和光照变化的局限

仿射变换：
- SIFT 对旋转和尺度变化有良好的不变性，但对大幅度的仿射变换（如透视变换）鲁棒性不足。
- 解决方法：使用 ASIFT（Affine-SIFT）等改进算法。
光照变化：
- SIFT 在小幅度光照变化下效果较好，但在强光照变化或非线性光照场景下（如阴影、反射）效果较差。

3. 专利问题（现已过期）

在专利保护期间（2004-2020），SIFT 的商业使用受到专利限制，无法在开源项目中直接使用。
专利过期后（2020 年），SIFT 开始被完全集成到诸如 OpenCV 的开源库中，解决了这一限制。

优缺点对比总结

特性	优点	缺点
尺度与旋转变化	对尺度、旋转变化完全不变	对仿射变换不够鲁棒
鲁棒性	对部分遮挡、噪声、小幅光照变化具有较高鲁棒性	对剧烈光照变化的鲁棒性有限
描述能力	高维特征描述子具有良好的区分能力	计算复杂度高，占用较多存储资源
实现与使用	经典算法，有成熟的实现与广泛的应用	专利问题曾限制商业使用，但现已过期

改进方向

计算优化：
- 使用 GPU 加速 SIFT 的计算过程。
- 简化特征描述子（如 PCA-SIFT）。
鲁棒性增强：
- 对仿射变换：采用 ASIFT 或直接引入深度学习特征提取方法。
- 对光照变化：结合对比度增强或多通道梯度分析。

5. SIFT 的改进与优化

尽管 SIFT 算法在特征提取领域具有重要地位，但其计算复杂度较高且对仿射变换和光照变化的鲁棒性有限。因此，研究者们提出了一系列优化方法和改进算法，以提升 SIFT 的计算效率、鲁棒性和适用性。

5.1 加速计算的优化方法

1. GPU 实现

背景：SIFT 的计算涉及大量的卷积、梯度计算和高斯金字塔构建，这些操作可以通过 GPU 的并行计算能力显著加速。
实现方式：
- 使用 CUDA 或 OpenCL 加速高斯模糊、差分计算和梯度方向直方图的生成。
- 常见的 GPU 加速 SIFT 实现如 VLFeat 库。
效果：相比 CPU 实现，GPU 加速版本的 SIFT 在大规模图像处理任务中可提升 10 倍以上的速度。

2. 近似计算

近似高斯滤波：使用盒式滤波器代替高斯滤波器，以降低计算复杂度。
减少描述子维度：用低维度替代 128 维的特征描述子（如 PCA-SIFT）。
降采样策略：对图像进行适度降采样，减少像素点和尺度层级。

5.2 改进的 SIFT 变种

1. PCA-SIFT

思想：用主成分分析（PCA）对特征描述子进行降维，从 128 维降为 20-36 维。
优点：
- 减少存储空间和计算复杂度。
- 在保持描述能力的同时提升匹配速度。
缺点：对特征点的方向分配和尺度变化的鲁棒性略有下降。

2. Dense-SIFT

思想：不像标准 SIFT 那样仅检测关键点，而是在图像的每个像素点上均匀采样特征描述子。
优点：
- 提供更密集的特征点，适用于图像分类和纹理分析任务。
- 对于结构性较强的图像（如重复纹理），效果显著提升。
缺点：计算量大，不适合实时任务。

3. RootSIFT

思想：对 SIFT 的描述子进行归一化处理后，取平方根以提升描述子的匹配性能。
- 根归一化公式：
  $\sqrt{\frac{d(i)}{\sum_{i=1}^N d(i)}}$
优点：
- 在图像匹配中性能优于标准 SIFT。
- 对于词袋模型等场景表现出更好的鲁棒性。
缺点：计算额外的根归一化步骤增加了一定复杂度。

5.3 与其他特征提取算法的对比

1. SURF（加速鲁棒特征）

特点：
- 使用 Hessian 矩阵的行列式快速计算关键点，替代 SIFT 的高斯差分计算。
- 描述子维度为 64，计算速度更快。
优点：
- 对旋转、尺度和光照变化具有良好鲁棒性。
- 在实时任务（如视频处理）中表现优异。
缺点：
- 描述子信息较少，区分性略低于 SIFT。
- 对复杂纹理或遮挡场景表现不如 SIFT。

2. ORB（快速和旋转不变的二进制描述符）

特点：
- 基于 FAST（Features from Accelerated Segment Test）角点检测和 BRIEF（Binary Robust Independent Elementary Features）描述符生成。
- 使用汉明距离进行快速匹配。
优点：
- 计算速度快，适合嵌入式设备和实时任务。
- 二进制描述符占用存储空间小。
缺点：
- 对复杂场景下的精度不如 SIFT。
- 对旋转和光照变化的鲁棒性有限。

3. Harris 角点检测

特点：
- 使用图像梯度计算角点特征，适合简单场景的特征提取。
优点：
- 实现简单，计算量低。
- 适合纹理丰富、无尺度变化的图像。
缺点：
- 不具备尺度和旋转不变性。
- 特征描述能力较弱。

对比总结

算法	尺度与旋转不变性	光照鲁棒性	描述能力	计算复杂度	适用场景
SIFT	很强	较强	很高	较高	图像匹配、拼接、目标识别
SURF	较强	较强	较高	较低	实时任务、简单场景
ORB	较弱	较弱	较低	很低	嵌入式设备、实时视频处理
Harris	无	很弱	低	低	基础角点检测、静态图像分析

6. SIFT 的实际应用

SIFT 算法因其在特征提取与匹配上的高鲁棒性和强描述能力，被广泛应用于多个计算机视觉领域。以下是 SIFT 的五大典型应用场景及其实现过程。

6.1 图像拼接（Panorama Stitching）

背景

图像拼接旨在将多幅重叠的图像拼接为一个无缝的全景图，在全景摄影、街景地图制作中具有广泛应用。

过程

特征点提取：
- 使用 SIFT 从所有图像中提取关键点和特征描述子。
特征点匹配：
- 基于欧氏距离找到重叠区域的匹配点。
几何变换估计：
- 使用 RANSAC 算法计算单应矩阵，剔除误匹配点。
图像对齐与拼接：
- 利用单应矩阵对图像进行投影变换，将图像对齐。
融合与裁剪：
- 处理拼接边缘，通过平滑融合技术优化拼接效果。

SIFT 的贡献

提供高鲁棒性的特征匹配，使拼接在不同视角、光照下表现良好。
在部分遮挡的场景下依然能够实现准确对齐。

6.2 目标检测与跟踪

背景

目标检测与跟踪广泛应用于智能安防、无人机视觉、自动驾驶等场景，用于定位目标并跟随其运动轨迹。

过程

模板生成：
- 从目标图像提取 SIFT 特征，生成目标模板。
检测与匹配：
- 在实时帧中提取 SIFT 特征，与目标模板进行特征匹配。
目标定位与跟踪：
- 通过匹配点计算目标位置，并在视频中持续跟踪其运动。
实时更新：
- 在目标外观发生变化时，动态更新目标模板特征。

SIFT 的贡献

对旋转和尺度变化具有不变性，可在复杂背景中稳定检测目标。
在光照变化和部分遮挡场景中依然具有高鲁棒性。

6.3 机器人导航

背景

机器人导航需要感知环境中的特征点，用以实现自定位和路径规划，广泛应用于自主移动机器人和无人驾驶汽车。

过程

环境感知：
- 使用 SIFT 提取场景特征点，生成环境特征地图。
位置估计：
- 将实时捕获的图像特征与环境地图进行匹配，确定机器人位姿。
路径规划：
- 根据机器人当前位置和目标位置，规划最优路径。
动态调整：
- 随环境变化实时更新特征点和路径信息。

SIFT 的贡献

对动态环境中的场景变化具有较高适应性。
提供可靠的特征点匹配，支持精确的视觉里程计（Visual Odometry）。

6.4 三维重建

背景

三维重建技术通过多幅图像生成物体或场景的三维模型，用于虚拟现实、文物保护和医学成像等领域。

过程

多视图特征提取：
- 在每幅图像中使用 SIFT 提取特征点。
特征点匹配：
- 在相邻视图之间匹配关键点，形成视图间的对应关系。
相机参数估计：
- 利用匹配点估算相机的内外参，恢复拍摄位置和角度。
三维点云生成：
- 通过多视几何原理计算关键点的三维坐标，生成初始点云。
模型优化：
- 通过稀疏重建、密集重建和纹理映射生成精细的三维模型。

SIFT 的贡献

确保跨视角图像间的特征点准确匹配。
对小角度和光照变化的鲁棒性提升了三维重建的精度。

6.5 视频检索与分析

背景

视频检索旨在从大量视频中快速找到与查询图像相关的片段，应用于视频监控、智能分析和多媒体搜索。

过程

帧级特征提取：
- 从每一帧中提取 SIFT 特征，构建特征数据库。
查询图像特征提取：
- 对输入的查询图像提取 SIFT 特征。
特征匹配与检索：
- 在特征数据库中匹配查询图像的特征点，找出相关视频帧。
后续分析：
- 对匹配结果进行目标检测、轨迹分析等深度处理。

SIFT 的贡献

高描述能力使其在遮挡和复杂背景下仍能准确检索目标。
对视频中帧间的光照变化和旋转运动具有良好适应性。

总结

应用场景	主要任务	SIFT 的贡献	局限性
图像拼接	全景图生成	高鲁棒性特征匹配，支持旋转与尺度变化	计算复杂度高
目标检测与跟踪	目标定位与跟随	精确匹配目标，在复杂背景中表现良好	实时性不足，对快速运动目标有限
机器人导航	环境感知、自定位与路径规划	可靠的特征点匹配支持视觉里程计和动态环境适应	对大规模场景的处理较慢
三维重建	重建场景的三维模型	高精度特征匹配支持多视图几何计算	对大视角和强光照变化有局限性
视频检索与分析	从视频中检索目标或相关片段	在遮挡和复杂场景下表现出色	海量视频特征提取的效率需进一步优化

7. 实战：SIFT 的代码实现

7.1 使用 OpenCV 调用 SIFT

OpenCV 的 SIFT API 简介

OpenCV 提供了对 SIFT 的高效实现，尤其是在专利过期后，SIFT 被重新纳入 OpenCV 开源库。通过 OpenCV 的 cv2.SIFT_create() 方法，我们可以快速调用 SIFT 进行特征提取和匹配。

主要方法：
1. SIFT_create()：创建 SIFT 对象。
2. detect()：检测关键点。
3. compute()：计算特征描述子。
4. detectAndCompute()：同时检测关键点并生成描述子。
5. BFMatcher 和 FlannBasedMatcher：用于特征点匹配。

SIFT 特征点提取与可视化

以下代码展示如何使用 OpenCV 提取图像的 SIFT 特征点并可视化结果：

import cv2
import matplotlib.pyplot as plt

# 读取图像
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)

# 创建 SIFT 对象
sift = cv2.SIFT_create()

# 检测关键点和计算描述子
keypoints, descriptors = sift.detectAndCompute(image, None)

# 可视化关键点
output_image = cv2.drawKeypoints(image, keypoints, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)

# 显示结果
plt.imshow(output_image, cmap='gray')
plt.title('SIFT Keypoints')
plt.axis('off')
plt.show()

SIFT 特征匹配的实现

以下代码展示如何使用 SIFT 提取特征点并进行特征匹配：

# 读取两张待匹配的图像
image1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
image2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)

# 提取 SIFT 特征
sift = cv2.SIFT_create()
keypoints1, descriptors1 = sift.detectAndCompute(image1, None)
keypoints2, descriptors2 = sift.detectAndCompute(image2, None)

# 创建特征匹配器
bf = cv2.BFMatcher(cv2.NORM_L2, crossCheck=True)

# 进行特征匹配
matches = bf.match(descriptors1, descriptors2)

# 根据匹配距离排序
matches = sorted(matches, key=lambda x: x.distance)

# 可视化匹配结果
result_image = cv2.drawMatches(image1, keypoints1, image2, keypoints2, matches[:50], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)

# 显示结果
plt.imshow(result_image)
plt.title('SIFT Feature Matching')
plt.axis('off')
plt.show()

7.2 从零实现一个简单的 SIFT

如果需要更深入的理解，可以从零实现一个简单的 SIFT 版本，包括高斯金字塔构建、关键点检测等。以下以 Python 为例：

图像预处理与高斯金字塔构建

import cv2
import numpy as np

def gaussian_blur(image, sigma):
    ksize = int(6 * sigma + 1)  # 确保高斯核尺寸为奇数
    return cv2.GaussianBlur(image, (ksize, ksize), sigma)

def build_gaussian_pyramid(image, num_octaves, num_scales, sigma):
    pyramid = []
    k = 2 ** (1 / num_scales)  # 尺度变化因子
    for octave in range(num_octaves):
        scales = []
        for scale in range(num_scales + 3):  # 额外两层用于差分
            sigma_scale = sigma * (k ** scale)
            blurred = gaussian_blur(image, sigma_scale)
            scales.append(blurred)
        pyramid.append(scales)
        image = cv2.pyrDown(image)  # 降采样
    return pyramid

关键点检测与特征描述子生成

def detect_keypoints(DoG_pyramid, threshold=0.03):
    keypoints = []
    for octave, scales in enumerate(DoG_pyramid):
        for i in range(1, len(scales) - 1):  # 避免首尾层
            prev, curr, next = scales[i - 1], scales[i], scales[i + 1]
            for y in range(1, curr.shape[0] - 1):
                for x in range(1, curr.shape[1] - 1):
                    value = curr[y, x]
                    if abs(value) > threshold and (
                        value == np.max(curr[y - 1:y + 2, x - 1:x + 2]) or
                        value == np.min(curr[y - 1:y + 2, x - 1:x + 2])
                    ):
                        keypoints.append((x, y, octave, i))
    return keypoints

特征匹配的实现

def match_features(descriptors1, descriptors2, ratio=0.75):
    matches = []
    for i, desc1 in enumerate(descriptors1):
        distances = np.linalg.norm(descriptors2 - desc1, axis=1)
        sorted_indices = np.argsort(distances)
        if distances[sorted_indices[0]] < ratio * distances[sorted_indices[1]]:
            matches.append((i, sorted_indices[0]))
    return matches

7.3 应用案例：图像拼接

案例实现

以下是使用 OpenCV 和 SIFT 实现图像拼接的示例代码：

import cv2
import numpy as np

# 读取图像
image1 = cv2.imread('image1.jpg', cv2.IMREAD_COLOR)
image2 = cv2.imread('image2.jpg', cv2.IMREAD_COLOR)

# 转为灰度图
gray1 = cv2.cvtColor(image1, cv2.COLOR_BGR2GRAY)
gray2 = cv2.cvtColor(image2, cv2.COLOR_BGR2GRAY)

# 提取 SIFT 特征
sift = cv2.SIFT_create()
keypoints1, descriptors1 = sift.detectAndCompute(gray1, None)
keypoints2, descriptors2 = sift.detectAndCompute(gray2, None)

# 特征匹配
bf = cv2.BFMatcher()
matches = bf.knnMatch(descriptors1, descriptors2, k=2)

# 过滤匹配点
good_matches = []
for m, n in matches:
    if m.distance < 0.75 * n.distance:
        good_matches.append(m)

# 提取匹配点位置
src_pts = np.float32([keypoints1[m.queryIdx].pt for m in good_matches]).reshape(-1, 1, 2)
dst_pts = np.float32([keypoints2[m.trainIdx].pt for m in good_matches]).reshape(-1, 1, 2)

# 计算单应性矩阵
H, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)

# 图像拼接
height, width = image1.shape[:2]
result = cv2.warpPerspective(image1, H, (width + image2.shape[1], height))
result[0:image2.shape[0], 0:image2.shape[1]] = image2

# 显示结果
cv2.imshow('Panorama', result)
cv2.waitKey(0)
cv2.destroyAllWindows()

附录

A. 数学公式推导

1. 高斯尺度空间公式

高斯尺度空间用于表示图像在不同尺度下的模糊程度。其数学表达式为：
$\sigma) = G(x, y, \sigma) * I(x, y)$
其中：

$\sigma) = \frac{1}{2\pi\sigma^2} e^{-\frac{x^2 + y^2}{2\sigma^2}})$ ：二维高斯函数。
$(*)$ ：表示卷积操作。
$(I (x, y))$ ：输入图像。
$(\sigma)$ ：尺度参数，决定平滑程度。

2. 高斯差分 (DoG) 公式

DoG 用于高效近似拉普拉斯算子，定义为：
$\sigma) = L(x, y, k\sigma) - L(x, y, \sigma)$
其中：

$(k)$ ：尺度倍数（通常为 $(\sqrt{2})$ ）。
$\sigma))$ ：不同尺度下的高斯模糊图像。

DoG 的本质是不同尺度高斯模糊图像的差分，其优点在于计算效率高，同时能够有效检测图像的显著特征点。

3. 梯度幅值与方向公式

在关键点邻域中计算梯度的幅值 (m(x, y)) 和方向 (\theta(x, y))：
$\sqrt{(L(x+1, y) - L(x-1, y))^2 + (L(x, y+1) - L(x, y-1))^2}$
$\theta(x, y) = \arctan\left(\frac{L(x, y+1) - L(x, y-1)}{L(x+1, y) - L(x-1, y)}\right)$
这些计算用于构建关键点的梯度方向直方图。

4. 特征描述子的生成

在每个关键点邻域内，将梯度幅值按照方向进行加权累加，生成直方图。通常将关键点邻域划分为 (4 \times 4) 的网格，每个网格的直方图包含 8 个方向，总共形成 128 维描述子。

B. SIFT 的经典论文资源

David G. Lowe, 2004
- 标题：Distinctive Image Features from Scale-Invariant Keypoints
- 链接：论文下载地址
- 内容简介：
  - 提出了 SIFT 算法的完整理论框架，包括高斯尺度空间、DoG 关键点检测、主方向分配和特征描述子生成。
  - 阐述了 SIFT 的鲁棒性和适用性，并给出了在图像拼接、目标检测等领域的应用案例。
David G. Lowe, 1999
- 标题：Object Recognition from Local Scale-Invariant Features
- 链接：论文下载地址
- 内容简介：
  - SIFT 的早期版本，主要聚焦于特征点的尺度不变性。
  - 为后续算法的改进奠定了基础。
进一步阅读
- Speeded-Up Robust Features (SURF) by Bay et al. (2006)：SURF 算法的提出，作为 SIFT 的加速版本。
- ORB: An efficient alternative to SIFT or SURF by Rublee et al. (2011)：二进制特征描述子的应用，专注于实时性和高效性。

C. 常见问题与解决方案（FAQ）

1. 为什么 SIFT 对图像旋转和尺度变化具有不变性？

原因：
- 尺度不变性通过高斯尺度空间实现，关键点检测基于 DoG 的局部极值。
- 旋转不变性通过主方向分配，使特征描述子与关键点方向对齐。
解决方案：
- 在大视角变化或仿射变换场景下，可结合 ASIFT 增强效果。

2. 为什么计算复杂度较高？如何优化？

原因：
- 高斯金字塔构建、关键点检测、梯度计算和特征描述子生成均涉及大量计算。
优化方法：
- 使用 GPU 并行计算（如 CUDA）。
- 采用简化版本的 SIFT（如 PCA-SIFT 或 SURF）。
- 利用 OpenCV 提供的优化实现。

3. 如何选择匹配方法以提升性能？

问题：
- 在大规模特征点匹配时，计算所有点对的距离可能导致性能瓶颈。
解决方案：
- 使用 k-d 树或 FLANN（快速近似最近邻搜索）加速匹配。
- 应用最近邻比值筛选法（阈值 0.75）剔除错误匹配。

4. SIFT 如何应对遮挡和光照变化？

应对遮挡：
- 使用局部特征点进行匹配，避免对全局特征的依赖。
应对光照变化：
- 梯度计算基于像素差分，对线性光照变化具有鲁棒性。
- 通过特征向量归一化，增强对非线性光照变化的适应性。

5. SIFT 是否适用于实时应用？

限制：
- 计算复杂度较高，在嵌入式设备或实时场景中可能不适用。
替代方案：
- 使用 SURF 或 ORB 等高效特征提取算法。
- 结合深度学习方法，如 CNN 特征或 Transformer 特征。

你可能感兴趣的:(算法,其他,算法)

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
云集怎么赚钱？云集APP分享购物赚钱攻略古楼
云集app怎么赚钱?云集app作为是一个全面的电商导购平台,提供诸如淘宝、京东、拼多多等各大平台的优惠券,其他同类型的导购平台相比,更加的全面,线上线下全面出击。如果你想通过云集赚钱,那你可以把这款APP推荐给淘宝(10亿用户)、拼多多(3亿用户)、京东(1亿用户)使用,那你能赚到他们购物返佣,也可以自己购物领优惠券能省不少钱,以后还有更多的商家与粉象合作,这么免费的App人人都需要,很好推广。至
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
中原焦点团队坚持原创分享第 1172天金JJ
信阳案例督导：在学生出现危机时，学校启动心理应急程序，一位心理老师安抚个案的同时，其他心理老师给班级同学进行团体心理辅导，学校方面马上通知家长前来学校。学校危机干预应急流程的成熟，能有效降低个案的自杀风险。个案不愿谈及家庭及自己自杀行为等问题时，用沙盘、玩具等分散注意力，谈论他感兴趣的话题，老师温和的态度，关切的言语，个案的情绪逐渐平复。从个案自己说的，流露的非言语，家长、老师、同学、以往的记录，
《家庭教育促进法》解读（14）落到实处方是真愿我们顺利平安
点击上方蓝字，关注我们吧！坚持写作第七十七天今天继续为大家解读和普及我国首部家庭类法律——《家庭教育促进法》的第四章“社会协同”。这一章是上一章“国家支持”的落脚点。第三十八条居民委员会、村民委员会可以依托城乡社区公共服务设施，设立社区家长学校等家庭教育指导服务站点，配合家庭教育指导机构组织面向居民、村民的家庭教育知识宣传，为未成年人的父母或者其他监护人提供家庭教育指导服务。个人认为这一点非常必要
小确幸5.23 聪聪和茵茵
图片发自App经常有好友问我，你是怎么教育孩子的？尽管我没仔细去思考这个问题，不过我还是知无不言，言无不尽的。每个孩子都是独特的，大概只有父母最为了解自己的孩子，所以其他人的做法不一定适合你的孩子，还是自己多用心去感受和体会这其中的酸甜苦辣吧。我想大概出于对孩子打出内心深处的爱，有时难免急燥粗暴地解决问题，但过后会反思，意识到自己的错误，会认真的和孩子交谈，并道歉。我是第一次当妈妈，你们是第一次当
父母别做“包工头”，让孩子做“小主人” 静云妈妈
文/静云妈妈很多父母，特别是爷爷奶奶外公外婆，俨然一个“包工头”，比如帮孩子穿衣、帮孩子喂饭、帮孩子洗漱、帮孩子处理与其他小朋友发生的冲突等等。这对孩子并不好，其实只是我们打着“爱孩子”的名义，剥夺了孩子自我发展的权利。像教孩子走路一样不会有哪位家长打算抱一个正常的孩子一辈子，我们总是在孩子适合的年龄想各种办法辅助孩子自己行走，最终孩子由摇摇摆摆到走得十分平顺，甚至跑步前进。面对孩子所有的事情，家
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
著作权登记申请流程知识产权宗师猫
著作权也就是版权登记一般经过下列程序：一、作品登记应提交的材料：1、作品登记申请书（由作品登记机关提供标准格式）；2、作者或其他著作权人的身份证明文件：作者身份证明（复印件，须作者签名）；法人或非法人单位的工商注册登记证明或其他相关证明文件（复印件）；继承人身份证明文件（复印件）；委托作品的委托合同（复印件）；合作作者的合作协议或合同及各合作作者的身份证明（复印件）。3、作品著作权归属证明文件：作
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
19.0-《超越感觉》-说服他人 SAM52
Becausethoughtfuljudgmentsdeservetobeshared,andthewaytheyarepresentedcanstronglyinfluencethewayothersreacttothem.因为经过深思熟虑的判断值得分享，而这些判断的呈现方式会强烈影响其他人对它们的反应。Bylearningtheprinciplesofpersuasionandapplying
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
时间是个神王家二少2
很多时候，我们站在原地，以为总会等到那个人。可是时光荏苒，命运就像不停发车的车站，直到某一天，我们才顿然了解，所有的一切都不会再来了。我们只是因为幼稚或单纯或其他的原因，上晚了车。我们所珍惜的，不一定是别人所留念的。每一段关系都有一个保质期，有的或许如钻石般恒远，有的却只如钢铁般，看似坚牢，却终会腐蚀、生锈，最后被其他的东西所替代。——当我我回头找你，却发现早已与你背道而驰。
瘫如葛优，动若泥鳅小鹿姐爱吃鸡爪
有时候，需要一个戏剧性的事件才能改变人们在育儿领域的陈旧观念，才能让人们从一个全新的视角去观察孩子存在的方式，才能利用简单的互动技巧帮助孩子应对成长当中必然会有的障碍。6岁前的孩子，大约除了8-24个月之间这些即将进入学步期和处于学步期之间的宝宝，会热衷于自己站立和走路，时常拒绝大人的拥抱，其他月龄的孩子都是有感兴趣的活动时动若泥鳅，没有感兴趣的活动时马上就瘫如葛优。早上起床：妈妈我走不动玩了5小
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
思维导图中的3A 画画的小常
图片发自App在学习思维导图3A之前，我们先来看看东方古国传统教书过程。分三步：听话，合作，变化。听话，学生摹仿老师，在这个过程中除非必需问题需要老师澄清解释，其他所有的都要求先行记忆。合作，这一阶段大多已经掌握基本知识点，允许学生提出问题，老师引导学生采用合适的方法，让学生亲自动手，解决问题。变化，经历了前面2个阶段，知识已经彻底掌握，此阶段要充分发挥洞察力和生发出新的思想以回馈老师。较之传统教
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/