从零开始学习人工智能

OpenCV 三维重建实战：从工业检测到自动驾驶，3 大场景代码全解析

：

工业零部件三维建模与检测
- 案例背景：在汽车制造工厂，对于复杂形状的发动机零部件质量检测与逆向工程需求，需要高精度的三维模型。传统检测方法效率低且精度有限，而三维重建技术可快速获取零部件三维信息，实现高效检测与设计优化。
- 技术实现：使用多个相机从不同角度拍摄零部件，利用calib3d模块进行相机标定，获取准确的相机内参和外参。通过特征点检测与匹配算法（如SIFT、ORB等）找到不同图像间的对应点，再用findEssentialMat计算本质矩阵，recoverPose恢复相机姿态，最后用triangulatePoints重建零部件的三维点云。
- 应用价值：通过对比重建模型与标准模型，能快速检测出零部件的尺寸偏差、表面缺陷等问题，精度可达亚毫米级。还可基于重建模型进行逆向工程，优化产品设计，缩短研发周期，提高生产效率与产品质量。
文化遗产数字化保护与修复
- 案例背景：面对历史悠久的古建筑和文物，自然侵蚀与人为破坏威胁其存在。为长期保存和研究，需要数字化手段记录其详细信息，为修复提供精准数据支持。
- 技术实现：在古建筑或文物现场，布置多个相机进行全方位拍摄。借助calib3d模块标定相机，通过特征匹配算法确定不同图像间对应关系，利用stereoCalibrate和stereoRectify对双目相机或多目相机进行校准和校正，获取视差图，再用reprojectImageTo3D将视差图转换为三维点云，构建高精度三维模型。
- 应用价值：完整记录文化遗产的外观和结构信息，为修复提供精确尺寸和形状数据，帮助文物保护工作者制定科学修复方案。还能基于三维模型开发虚拟展示项目，让公众更直观了解文化遗产，促进文化传承与保护。
自动驾驶场景感知与地图构建
- 案例背景：自动驾驶汽车需要实时感知周围环境，构建高精度地图以实现路径规划和安全行驶。准确的三维重建能帮助汽车识别障碍物、判断距离和预测物体运动轨迹。
- 技术实现：汽车上安装多个摄像头，结合激光雷达等传感器。利用calib3d模块标定相机，通过视觉里程计算法（如基于特征点匹配和相机位姿估计）确定汽车的运动轨迹，用solvePnP计算物体的三维位置，结合激光雷达数据进行融合，构建精确的三维地图。
- 应用价值：提升自动驾驶系统的环境感知能力，增强对复杂路况和障碍物的识别与应对能力，提高行驶安全性。精确的三维地图为路径规划提供更准确信息，优化行驶路线，提高出行效率，推动自动驾驶技术发展。 ### OpenCV calib3d模块三维重建实际案例

案例1：基于双目相机的室内场景三维重建

这是一个使用双目相机进行室内场景三维重建的完整流程，包括相机标定、立体校正、视差计算和点云生成：

import cv2
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# 1. 相机标定（假设已经完成，直接加载标定结果）
def load_calibration_results():
    # 加载左右相机内参和畸变系数
    left_camera_matrix = np.array([
        [832.73, 0, 318.22],
        [0, 831.99, 242.15],
        [0, 0, 1]
    ])
    left_dist_coeffs = np.array([-0.365, 0.132, 0.001, 0.002, -0.027])
    
    right_camera_matrix = np.array([
        [830.47, 0, 321.54],
        [0, 829.87, 245.11],
        [0, 0, 1]
    ])
    right_dist_coeffs = np.array([-0.371, 0.139, 0.003, 0.001, -0.029])
    
    # 双目相机关系参数
    R = np.array([
        [0.9998, -0.0153, 0.0104],
        [0.0153, 0.9999, -0.0006],
        [-0.0104, 0.0007, 0.9999]
    ])
    T = np.array([-119.97, 0.35, 1.22])  # 基线距离（毫米）
    
    return left_camera_matrix, left_dist_coeffs, right_camera_matrix, right_dist_coeffs, R, T

# 2. 双目相机立体校正
def stereo_rectify(left_img, right_img):
    # 加载标定结果
    K1, D1, K2, D2, R, T = load_calibration_results()
    
    # 图像尺寸
    h, w = left_img.shape[:2]
    
    # 计算校正变换
    R1, R2, P1, P2, Q, validPixROI1, validPixROI2 = cv2.stereoRectify(
        K1, D1, K2, D2, (w, h), R, T, alpha=0)
    
    # 生成校正映射
    map1x, map1y = cv2.initUndistortRectifyMap(K1, D1, R1, P1, (w, h), cv2.CV_32FC1)
    map2x, map2y = cv2.initUndistortRectifyMap(K2, D2, R2, P2, (w, h), cv2.CV_32FC1)
    
    # 应用校正
    rectified_left = cv2.remap(left_img, map1x, map1y, cv2.INTER_LINEAR)
    rectified_right = cv2.remap(right_img, map2x, map2y, cv2.INTER_LINEAR)
    
    return rectified_left, rectified_right, Q

# 3. 计算视差图
def compute_disparity(left_img, right_img):
    # 使用StereoSGBM算法（更精确但速度较慢）
    window_size = 3
    min_disp = 0
    num_disp = 112 - min_disp
    stereo = cv2.StereoSGBM_create(
        minDisparity=min_disp,
        numDisparities=num_disp,
        blockSize=5,
        P1=8 * 3 * window_size ** 2,
        P2=32 * 3 * window_size ** 2,
        disp12MaxDiff=1,
        uniquenessRatio=15,
        speckleWindowSize=0,
        speckleRange=2,
        preFilterCap=63,
        mode=cv2.STEREO_SGBM_MODE_SGBM_3WAY
    )
    
    # 计算视差
    disparity = stereo.compute(left_img, right_img).astype(np.float32) / 16.0
    
    # 归一化视差图以便显示
    disparity_normalized = cv2.normalize(disparity, None, 0, 255, cv2.NORM_MINMAX, dtype=cv2.CV_8U)
    
    return disparity, disparity_normalized

# 4. 从视差图生成点云
def generate_point_cloud(disparity, Q, left_img=None):
    # 从视差图和校正矩阵计算3D点
    points_3d = cv2.reprojectImageTo3D(disparity, Q)
    
    # 如果提供了左图像，则使用颜色信息
    if left_img is not None:
        colors = cv2.cvtColor(left_img, cv2.COLOR_BGR2RGB)
        mask = disparity > disparity.min()
        out_points = points_3d[mask]
        out_colors = colors[mask]
    else:
        mask = disparity > disparity.min()
        out_points = points_3d[mask]
        out_colors = None
    
    return out_points, out_colors

# 5. 可视化点云（使用matplotlib）
def visualize_point_cloud(points, colors=None):
    fig = plt.figure(figsize=(10, 8))
    ax = fig.add_subplot(111, projection='3d')
    
    # 设置坐标轴范围
    max_range = np.array([
        points[:, 0].max() - points[:, 0].min(),
        points[:, 1].max() - points[:, 1].min(),
        points[:, 2].max() - points[:, 2].min()
    ]).max() / 2.0
    
    mid_x = (points[:, 0].max() + points[:, 0].min()) * 0.5
    mid_y = (points[:, 1].max() + points[:, 1].min()) * 0.5
    mid_z = (points[:, 2].max() + points[:, 2].min()) * 0.5
    
    ax.set_xlim(mid_x - max_range, mid_x + max_range)
    ax.set_ylim(mid_y - max_range, mid_y + max_range)
    ax.set_zlim(mid_z - max_range, mid_z + max_range)
    
    # 绘制点云
    if colors is not None:
        ax.scatter(points[:, 0], points[:, 1], points[:, 2], c=colors/255.0, s=2)
    else:
        ax.scatter(points[:, 0], points[:, 1], points[:, 2], c='b', s=2)
    
    ax.set_xlabel('X')
    ax.set_ylabel('Y')
    ax.set_zlabel('Z')
    plt.title('3D Point Cloud')
    plt.show()

# 主函数
def main():
    # 读取双目图像
    left_img = cv2.imread('left_image.jpg')
    right_img = cv2.imread('right_image.jpg')
    
    # 确保图像为灰度图
    if len(left_img.shape) == 3:
        left_gray = cv2.cvtColor(left_img, cv2.COLOR_BGR2GRAY)
    else:
        left_gray = left_img
    
    if len(right_img.shape) == 3:
        right_gray = cv2.cvtColor(right_img, cv2.COLOR_BGR2GRAY)
    else:
        right_gray = right_img
    
    # 立体校正
    rectified_left, rectified_right, Q = stereo_rectify(left_gray, right_gray)
    
    # 计算视差
    disparity, disparity_normalized = compute_disparity(rectified_left, rectified_right)
    
    # 生成点云
    points, colors = generate_point_cloud(disparity, Q, left_img)
    
    # 可视化结果
    cv2.imshow('Left Image', left_img)
    cv2.imshow('Right Image', right_img)
    cv2.imshow('Rectified Left', rectified_left)
    cv2.imshow('Rectified Right', rectified_right)
    cv2.imshow('Disparity Map', disparity_normalized)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    # 显示点云
    visualize_point_cloud(points, colors)

if __name__ == "__main__":
    main()

案例2：基于单目相机的运动恢复结构（SfM）

下面是一个简化的单目SfM流程，通过多幅图像重建3D场景：

import cv2
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from scipy.spatial.transform import Rotation

# 1. 特征提取与匹配
def feature_detection_and_matching(img1, img2):
    # 使用ORB特征检测器
    orb = cv2.ORB_create()
    
    # 检测关键点和描述符
    kp1, des1 = orb.detectAndCompute(img1, None)
    kp2, des2 = orb.detectAndCompute(img2, None)
    
    # 使用BFMatcher匹配描述符
    bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
    matches = bf.match(des1, des2)
    
    # 按距离排序
    matches = sorted(matches, by=lambda x: x.distance)
    
    # 获取匹配点
    points1 = np.float32([kp1[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)
    points2 = np.float32([kp2[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)
    
    return points1, points2, matches, kp1, kp2

# 2. 计算本质矩阵和相机位姿
def estimate_pose(points1, points2, camera_matrix):
    # 计算本质矩阵
    E, mask = cv2.findEssentialMat(points1, points2, camera_matrix, method=cv2.RANSAC, prob=0.999, threshold=1.0)
    
    # 从本质矩阵恢复旋转和平移
    points, R, t, mask = cv2.recoverPose(E, points1, points2, camera_matrix)
    
    return E, R, t, mask

# 3. 三角测量恢复3D点
def triangulate_points(points1, points2, R1, t1, R2, t2, camera_matrix):
    # 构建投影矩阵
    P1 = np.dot(camera_matrix, np.hstack((R1, t1)))
    P2 = np.dot(camera_matrix, np.hstack((R2, t2)))
    
    # 三角测量
    points_4d = cv2.triangulatePoints(P1, P2, points1.T, points2.T)
    points_3d = points_4d[:3, :] / points_4d[3, :]
    
    return points_3d.T

# 4. 主重建流程
def main():
    # 相机内参矩阵（示例值，需根据实际相机标定）
    camera_matrix = np.array([
        [800, 0, 320],
        [0, 800, 240],
        [0, 0, 1]
    ])
    
    # 读取图像序列
    img1 = cv2.imread('image1.jpg')
    img2 = cv2.imread('image2.jpg')
    img3 = cv2.imread('image3.jpg')
    
    # 转为灰度图
    gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
    gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
    gray3 = cv2.cvtColor(img3, cv2.COLOR_BGR2GRAY)
    
    # 第一对图像的特征匹配和位姿估计
    points1_1, points1_2, matches1, kp1_1, kp1_2 = feature_detection_and_matching(gray1, gray2)
    E1, R1, t1, mask1 = estimate_pose(points1_1, points1_2, camera_matrix)
    
    # 第二对图像的特征匹配和位姿估计
    points2_1, points2_2, matches2, kp2_1, kp2_2 = feature_detection_and_matching(gray2, gray3)
    E2, R2, t2, mask2 = estimate_pose(points2_1, points2_2, camera_matrix)
    
    # 初始相机位姿（第一幅图像为世界坐标系原点）
    R_cam1 = np.eye(3)
    t_cam1 = np.zeros((3, 1))
    
    # 第二幅图像的相机位姿
    R_cam2 = R1
    t_cam2 = t1
    
    # 第三幅图像的相机位姿（相对于第二幅图像）
    R_cam3 = np.dot(R2, R_cam2)
    t_cam3 = np.dot(R2, t_cam2) + t2
    
    # 三角测量第一对图像的3D点
    points_3d_1 = triangulate_points(
        points1_1[mask1.ravel() > 0].reshape(-1, 2),
        points1_2[mask1.ravel() > 0].reshape(-1, 2),
        R_cam1, t_cam1, R_cam2, t_cam2, camera_matrix
    )
    
    # 三角测量第二对图像的3D点（只考虑与第一对图像的共同特征）
    # 实际应用中需要进行特征跟踪和 Bundle Adjustment
    
    # 可视化点云和相机位姿
    fig = plt.figure(figsize=(10, 8))
    ax = fig.add_subplot(111, projection='3d')
    
    # 绘制3D点
    ax.scatter(points_3d_1[:, 0], points_3d_1[:, 1], points_3d_1[:, 2], c='b', s=2)
    
    # 绘制相机位置
    ax.scatter(0, 0, 0, c='r', s=100, marker='^')  # 相机1
    
    # 绘制相机2的位置和朝向
    cam2_pos = -np.dot(R_cam2.T, t_cam2).flatten()
    ax.scatter(cam2_pos[0], cam2_pos[1], cam2_pos[2], c='g', s=100, marker='^')
    
    # 绘制相机3的位置和朝向
    cam3_pos = -np.dot(R_cam3.T, t_cam3).flatten()
    ax.scatter(cam3_pos[0], cam3_pos[1], cam3_pos[2], c='m', s=100, marker='^')
    
    # 设置坐标轴范围
    max_range = np.array([
        points_3d_1[:, 0].max() - points_3d_1[:, 0].min(),
        points_3d_1[:, 1].max() - points_3d_1[:, 1].min(),
        points_3d_1[:, 2].max() - points_3d_1[:, 2].min()
    ]).max() / 2.0
    
    mid_x = (points_3d_1[:, 0].max() + points_3d_1[:, 0].min()) * 0.5
    mid_y = (points_3d_1[:, 1].max() + points_3d_1[:, 1].min()) * 0.5
    mid_z = (points_3d_1[:, 2].max() + points_3d_1[:, 2].min()) * 0.5
    
    ax.set_xlim(mid_x - max_range, mid_x + max_range)
    ax.set_ylim(mid_y - max_range, mid_y + max_range)
    ax.set_zlim(mid_z - max_range, mid_z + max_range)
    
    ax.set_xlabel('X')
    ax.set_ylabel('Y')
    ax.set_zlabel('Z')
    plt.title('3D Reconstruction with SfM')
    plt.show()

if __name__ == "__main__":
    main()

案例3：基于ArUco标记的物体位姿估计

下面是一个使用ArUco标记进行物体位姿估计的示例，可用于AR增强现实应用：

import cv2
import numpy as np

# 1. 加载相机标定参数（假设已经完成标定）
def load_camera_params():
    # 相机内参矩阵
    camera_matrix = np.array([
        [832.73, 0, 318.22],
        [0, 831.99, 242.15],
        [0, 0, 1]
    ])
    
    # 畸变系数
    dist_coeffs = np.array([-0.365, 0.132, 0.001, 0.002, -0.027])
    
    return camera_matrix, dist_coeffs

# 2. 检测ArUco标记并估计位姿
def detect_aruco_and_estimate_pose(image):
    # 加载相机参数
    camera_matrix, dist_coeffs = load_camera_params()
    
    # 创建ArUco字典和参数
    aruco_dict = cv2.aruco.Dictionary_get(cv2.aruco.DICT_6X6_250)
    aruco_params = cv2.aruco.DetectorParameters_create()
    
    # 检测ArUco标记
    corners, ids, rejected = cv2.aruco.detectMarkers(image, aruco_dict, parameters=aruco_params)
    
    # 如果检测到标记
    if ids is not None and len(ids) > 0:
        # 绘制检测到的标记
        image = cv2.aruco.drawDetectedMarkers(image.copy(), corners, ids)
        
        # 标记大小（米）
        marker_size = 0.05  # 5厘米
        
        # 估计每个标记的位姿
        rvecs, tvecs, _ = cv2.aruco.estimatePoseSingleMarkers(corners, marker_size, camera_matrix, dist_coeffs)
        
        # 绘制每个标记的坐标轴
        for i in range(len(ids)):
            cv2.aruco.drawAxis(image, camera_matrix, dist_coeffs, rvecs[i], tvecs[i], 0.1)  # 绘制0.1米长的坐标轴
            
            # 打印每个标记的位置和姿态
            print(f"Marker ID: {ids[i][0]}")
            print(f"Position (x, y, z): {tvecs[i][0]}")
            
            # 旋转向量转旋转矩阵
            R, _ = cv2.Rodrigues(rvecs[i])
            # 旋转矩阵转欧拉角
            r = Rotation.from_matrix(R)
            euler_angles = r.as_euler('xyz', degrees=True)
            print(f"Orientation (roll, pitch, yaw): {euler_angles}")
            print("-------------------")
    
    return image

# 3. 主函数（从摄像头捕获视频）
def main():
    # 打开摄像头
    cap = cv2.VideoCapture(0)
    
    while True:
        # 读取一帧
        ret, frame = cap.read()
        if not ret:
            break
        
        # 检测ArUco标记并估计位姿
        result = detect_aruco_and_estimate_pose(frame)
        
        # 显示结果
        cv2.imshow('ArUco Marker Detection', result)
        
        # 按ESC键退出
        if cv2.waitKey(1) & 0xFF == 27:
            break
    
    # 释放资源
    cap.release()
    cv2.destroyAllWindows()

if __name__ == "__main__":
    main()

应用领域案例

1. 工业自动化中的机器人视觉引导

任务：机器人抓取不规则物体
技术：双目立体视觉系统计算物体3D位置
实现：
- 使用两个相机构建立体视觉系统
- 标定相机并计算相对位置关系
- 计算物体表面点云
- 提取物体轮廓和特征点
- 规划机器人抓取路径

2. 文化遗产数字化保护

任务：对古建筑进行高精度3D建模
技术：多视图立体重建（MVS）
实现：
- 从不同角度拍摄古建筑照片
- 使用SfM技术估计相机位姿
- 密集匹配生成点云
- 点云处理与三角网格化
- 纹理映射生成真实感模型

3. 增强现实游戏开发

任务：在真实场景中叠加虚拟物体
技术：基于标记或无标记的位姿估计
实现：
- 使用ArUco或AprilTag等标记检测
- 计算相机相对于标记的位姿
- 根据位姿在正确位置渲染虚拟物体
- 处理阴影和光照效果增强真实感

4. 自动驾驶环境感知

任务：检测道路、车辆和障碍物
技术：双目立体视觉+深度学习
实现：
- 双目相机计算视差图
- 从视差图生成点云
- 点云分割识别地面、车辆和行人
- 结合深度学习语义分割增强识别精度
- 构建环境3D模型用于路径规划

通过这些案例可以看出，OpenCV的calib3d模块为计算机视觉中的3D重建提供了基础工具，结合其他技术（如深度学习）可以构建更强大的应用系统。

2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
使用OpenCV对视频进行处理：视频读取、视频显示和视频保存，视频追踪等无规则ai OpenCV opencv 人工智能计算机视觉 python
一.视频的读写1.从文件中读取视频并播放（1）创建读取视频的对象cap=cv2.VideoCapture(filepath)filepath：视频文件的路径（2）视频的属性信息a.获取视频的某些属性retval=cap.get(propId)propId：从0到18的数字，每个数字表示视频的属性常用的属性有属性名对应数值功能描述CAP_PROP_POS_MSEC0视频当前的播放位置，单位为毫秒。C
OpenCV读取视频帧卡死的BUG修复 henysugar opencv 音视频 bug
OpenCV读取指定视频文件如果异常的时候，会卡死一直不退出，问题是卡在CvCapture_MSMF::grabVideoFrame函数内，跟了一下，发现有个判断有点问题，其下面的源码：while(!stopFlag) { for(;;) { CV_TRACE_REGION("ReadSample"); if(!SUCCEEDED(hr=videoFileSour
AI 绘画 + 编程：10 分钟生成个性化艺术作品大力出奇迹985 人工智能
本文围绕Python+OpenCV实现自动人脸识别门禁系统展开，先概述系统的基本构成与作用，再从系统核心技术、开发实现步骤、功能扩展方向、实际应用场景及优化改进策略五个方面详细阐述，最后总结系统的价值与发展前景，为相关开发和应用提供全面参考。一、系统核心技术解析人脸识别技术是门禁系统的核心，其关键在于对人脸特征的精准提取与匹配。OpenCV作为开源计算机视觉库，提供了丰富的人脸检测算法，如Haar
边缘计算与云计算协同：未来架构的黄金组合大力出奇迹985 边缘计算云计算架构
边缘计算与云计算的协同融合，正成为支撑未来智能社会的核心架构。本文从技术互补性、应用场景拓展、架构安全保障、性能优化路径和未来发展趋势五个维度，系统剖析二者协同的底层逻辑与实践价值。通过分析边缘节点的实时处理能力与云端的全局算力优势如何形成合力，探讨该架构在工业互联网、自动驾驶、智慧城市等领域的创新应用，并针对安全防护、资源调度等关键问题提出解决方案，最终总结其对数字经济发展的战略意义。一、技术互
RK3568平台（camera篇）opencv处理图像嵌入式_笔记瑞芯微 opencv 人工智能计算机视觉
一.颜色转换cv2.cvtColor()函数功能：将一幅图像从一个色彩空间转换到另一个色彩空间。函数原型：cv2.cvtColor(src,code,dst=None,dstCn=None)参数定义：src:要转换的源文件code，转换的色彩空间，在opencv中有超过150种颜色空间转换方法,但是经常用的只有BGR-灰度图和BGR-HSVBGR和灰度图的转换使用cv2.COLOR_BGR2GRA
RK3568笔记九十二：QT使用Opencv显示摄像头殷忆枫 RK3568学习笔记笔记
若该文为原创文章，转载请注明原文出处。测试使用QT调用Opencv的API显示摄像头，板子为正点原子的RK3568，最终想实现的是在RK3568平台上使用Qt框架进行部署，利用NPU推理加速视频目标识别。此篇为测试功能代码为正点原子提供的代码，直接用来测试，在未看代码时一直不明白怎么添加opencv的库，后面明白了，只增加了下面的两行：CONFIG+=link_pkgconfigPKGCONFIG
AI人工智能为空间智能领域带来的科技革新 AI云原生与云计算技术学院 AI云原生与云计算人工智能科技 ai
AI人工智能为空间智能领域带来的科技革新关键词：人工智能、空间智能、计算机视觉、SLAM、空间计算、增强现实、自动驾驶摘要：本文将深入探讨人工智能如何革新空间智能领域。我们将从基本概念出发，逐步分析AI在空间感知、理解和交互方面的突破性进展，包括SLAM技术、3D重建、空间计算等核心应用。通过生动的比喻和实际案例，揭示AI如何赋予机器"空间思维"能力，并展望这一技术融合的未来发展趋势。背景介绍目的
《零基础入门AI：从图像梯度到凸包特征检测（OpenCV图像特征提取）》竹子_23 OpenCV入门 opencv 人工智能计算机视觉
一、图像梯度处理：理解像素变化的本质1.1图像梯度基础图像梯度是计算机视觉中的核心概念，它描述了图像中像素强度的变化情况：梯度方向：像素值变化最剧烈的方向（垂直于边缘）梯度幅度：像素值变化的强度（值越大表示边缘越明显）物理意义：就像地形图中的等高线，梯度大的地方相当于陡坡，梯度小的地方相当于平地1.2垂直边缘提取垂直边缘是图像中物体左右边界形成的线条：特征：水平方向上像素值发生突变应用场景：文档扫
《零基础入门AI：OpenCV图像预处理进一步学习》竹子_23 OpenCV入门 opencv 人工智能学习
本文全面讲解OpenCV图像预处理的七大核心技术（插值方法、边缘填充、图像矫正（透视变换）、图像掩膜、ROI切割、图像添加水印、图像噪点消除），每个知识点都配有详细解释和实用代码示例，帮助初学者建立系统的图像处理知识体系。一、插值方法：图像缩放的核心技术插值是在图像缩放或旋转时估算新像素值的方法，不同方法在速度和质量上有显著差异。1.最近邻插值原理：直接取最邻近像素的值特点：速度最快，但会产生锯齿
OpenCV基础02_图像预处理白槿_cha 计算机视觉基础 opencv 人工智能计算机视觉笔记
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学一、图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂
小白学视觉 | 在OpenCV中进行图像预处理双木的木深度学习拓展阅读人工智能机器学习深度学习 opencv 计算机视觉图像处理 ai
本文来源公众号“小白学视觉”，仅用于学术分享，侵权删，干货满满。原文链接：在OpenCV中进行图像预处理今天，我们进一步深入，并处理在图像处理中常用的形态学操作。形态学操作用于提取区域、边缘、形状等。什么是形态学操作？形态学操作是在二值图像上进行的。二值图像可能包含许多不完美之处。特别是由一些简单的阈值操作产生的二值图像（如果你对阈值不熟悉，现在不用担心）可能包含许多噪声和畸变。OpenCV库中提
【OpenCV基础】凸包检测、Harris角点检测、Canny边缘检测
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载请注明出处文章目录一、凸包检测API1.drawContours2.convexHull全部代码-有滑动条效果展示部分代码-无滑动条二、Harris角点检测角
使用Python，OpenCV计算跑图的图像彩色度程序媛一枚~ Python OpenCV Python进阶 python opencv 开发语言
使用Python，OpenCV计算跑图的图像彩色度这篇博客将介绍如何计算跑图里最鲜艳的top25图片和最灰暗的top25图片并显示色彩彩色度值展示。效果图以下分别是最鲜艳top25和最灰暗top25对比效果图：最鲜艳top25效果图：最灰暗top25效果图如下：源码见如下链接https://blog.csdn.net/qq_40985985/article/details/115014533#US
OpenCV（11）边缘检测、轮廓绘制、简单平移距离测量 C++ sam-zy
1.边缘检测原文链接：http://blog.sina.com.cn/s/blog_154bd48ae0102weuk.html边缘检测的一般步骤：1.滤波边缘检测的算法主要是基于图像的一阶和二阶导数。但是导数通常对噪声很敏感，所以首先要用滤波器降低噪声。常见的滤波方法主要是高斯滤波。2.增强增强边缘的基础是确定图像各点领域强度的变化值。增强算法可以将图像灰度点邻域强度值有显著变化的点凸现出来，在
OpenCV图像梯度边缘轮廓处理 Jiamusi_night opencv 计算机视觉人工智能
一、梯度处理的sobel算子函数函数名：cv2.Sobel(src,ddepth,dx,dy,ksize=3,scale=1,delta=0,borderType=None)功能：用于计算图像梯度（gradient）的函数参数：src:输入图像，它应该是灰度图像。ddepth:输出图像的所需深度（数据类型）。通常，你可以使用-1来表示与输入图像相同的深度，或者使用如cv2.CV_64F等来指定特定
【人工智能-14】OpenCV梯度处理、边缘检测、绘制轮廓、凸包检测、轮廓特征查找 m0_64233047 人工智能 opencv 计算机视觉
上一期【人工智能-13】OpenCV插值方法，边缘填充，图像矫正，图像掩膜，图像融合与噪点消除文章目录一、梯度处理1.图像梯度2.垂直边缘提取3.Sobel算子4.Laplacian算子二、边缘检测1.高斯模糊（降噪）2.计算梯度强度和方向3.非极大值抑制（NMS）4.双阈值检测5.边缘连接（滞后阈值）三、绘制轮廓1.什么是轮廓2.寻找轮廓3.轮廓绘制四、凸包检测1.穷举法2.QuickHull五
OpenCV+Python
安装OpenCV：Python：直接pipinstallopencv-python（核心库）和opencv-contrib-python（扩展功能）。pipinstallopencv-pythonpipinstallopencv-contrib-python验证安装：importcv2print(cv2.__version__)#输出版本号以下代码来源于：链接if__name__=='__main
研讨会预告：基于 NVIDIA Omniverse 构建 Physical AI 应用，解锁 Physical AI 的落地路径 CSDN资讯人工智能
在生成式AI持续革新虚拟内容生产的同时，一种面向现实世界的AI正悄然兴起——物理AI(PhysicalAI)。它赋能机器人、自动驾驶等自主系统在三维空间中完成感知、理解与互动，让AI走出屏幕，触碰现实。借助NVIDIAOmniverse、Cosmos、IsaacSim等平台，开发者正在加速构建真实可用的物理智能体。加入本期精讲堂，探索如何利用端到端工具链快速推进AI与物理世界的深度融合。基于NVI
2024智能交通趋势：提示工程架构师用AI提示词引领技术变革 AIGC应用创新大全人工智能 ai
2024智能交通趋势：提示工程架构师用AI提示词引领技术变革副标题：从自动驾驶决策到城市交通大脑——大语言模型提示工程实战指南摘要/引言问题陈述：智能交通系统正面临前所未有的复杂性挑战——自动驾驶车辆需要实时处理多源异构数据，城市交通管理需平衡效率与安全，出行服务平台要满足个性化需求。传统AI开发模式依赖大量标注数据和专业领域知识，导致系统迭代缓慢、场景适应性差。当大语言模型(LLM)成为通用人工
【Python】Pillow 2 宅男很神经 python 开发语言
3.2.1色彩空间(ColorSpace)与色彩模型(ColorModel)基础色彩模型(ColorModel):色彩模型是一种抽象的数学模型，用一组数值（通常是三个或四个分量）来描述颜色。常见的色彩模型有：RGB(Red,Green,Blue):加色模型，常用于显示器、扫描仪、数码相机。通过混合不同强度的红、绿、蓝三原色光来产生各种颜色。CMY(Cyan,Magenta,Yellow):减色模型
Python代码库OpenCV之11 切割碑文 iCloudEnd
本文代码来自https://blog.csdn.net/u010095372/article/details/79420641源代码适用于python2，我做个简单修改测试图片测试图片代码#-*-coding:utf-8-*-importosimportnumpyasnpimportcv2.cv2ascvfrommatplotlibimportpyplotaspltimportheapqimpor
端到端-未来还是现实 Monkey PilotX 自动驾驶人工智能自动驾驶计算机视觉
自动驾驶的“终极梦想”是什么？“自动驾驶不是拼积木，而是教会一台机器像人一样开车。”过去几年，自动驾驶技术在公众视野中经历了从“热血科幻”到“冷静现实”的转变。你可能听过各种术语：L2、L3、NOA、城市领航、BEV感知……但最近，一个词越来越频繁地出现在技术圈和发布会上——端到端（End-to-End）自动驾驶。它听起来像是某种“黑科技”，但又让人摸不着头脑。它到底是什么？和传统的自动驾驶系统有
opencv-day2-图像预处理1 谢眠 OpenCV opencv 计算机视觉
图像预处理在计算机视觉和图像处理领域，图像预处理能够提高后续处理（如特征提取、目标检测等）的准确性和效率。常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂直翻转或同时水平和垂直翻转。这个函数接受两个参数：要翻转的图像和一个指定翻
opencv-day3-图像预处理
图像滤波所为图像滤波通过滤波器得到另一个图像什么是滤波器在深度学习中，滤波器又称为卷积核，滤波的过程成为卷积卷积核概念卷积核大小，一般为奇数，是为了保证锚点在中间，防止位置发生偏移的原因什么是锚点？卷积核大小的影响在深度学习中，卷积核越大，看到的信息越多，提取的特征越好，同时计算量越大图像平滑处理图像噪声的定义和性质‌‌‌图像噪声‌是指存在于图像数据中的不必要的或多余的干扰信息。它妨碍了人们通过视
2025中国自动智能驾驶企业排行：最好的自动驾驶是哪家？潮湿的心情自动驾驶人工智能机器学习
在智能驾驶技术加速落地的2025年，中国智能驾驶行业竞争格局迎来新变革。数据驱动的创新模式与全栈技术的深度整合成为核心竞争力，头部企业在技术壁垒、商业化速度与成本控制的多维较量中展现出不同的发展路径。以下为中国智能驾驶五强企业排行，聚焦Momenta、华为、比亚迪、百度Apollo等企业的突破性表现。第一名：Momenta作为国内首个基于一段式端到端大模型实现规模化量产的智能驾驶供应商，Momen
基于Opencv的手势识别双马尾为什么是神 opencv 人工智能计算机视觉
thumb目录项目背景项目概览功能实现分类器选择数据收集与处理数据增强与傅里叶描述子计算SVM训练GUI设计未来展望项目背景回首过去一年半的大学时光，我深感自己过于安逸。没有明确的目标，对于学习也不太上心。倘若继续这样浑浑噩噩过下去，即便以后只想得过且过地过普通生活，最终结果恐怕难遂人愿。“取乎其上，得乎其中；取乎其中，得乎其下；取乎其下，则无所得矣。”于是乎我制定了与未来展望相匹配的学习路径，哪
每日简报 6月16日简报新鲜事每天一分钟了解新鲜事！简报新鲜事
今日简报6月16号简报新鲜事，星期四，好运连连，生活喜乐！1、国务院客户端上线新功能：一键可查询家里老人孩子核酸结果；2、工信部：将出台自动驾驶相关标准并试点；3、上汽通用五菱：宝骏2023款KiWiEV车型将搭载大疆车载系统;4、北京天堂超市酒吧被列入严重违法失信名单；5、国家统计局：年轻人失业率偏高需高度重视;6、全国统一电子烟交易管理平台上线：电子烟行业开启溯源监管，实现从交易商流、物流、资
创建全景图像的完整指南：Make-Panorama-Image实战教程色空空色
本文还有配套的精品资源，点击获取简介：在IT领域，全景图像创建技术用于合并多张连续拍摄的照片以获得宽广视角。本教程将介绍使用Python和JupyterNotebook实现全景图像生成的步骤，包括图像对齐、融合、扭曲校正和裁剪调整。通过学习OpenCV、PIL/Pillow和scikit-image等库的使用，你将掌握创建和处理全景图像的技术。1.全景图像生成的步骤与原理全景图像（Panorama
opencv学习（图像金字塔）蓝桉802 opencv 学习人工智能
1.什么是图像金字塔图像金字塔是一种多尺度图像表示方法，通过对原始图像进行下采样（缩小）和上采样（放大），生成一系列不同分辨率的图像集合，形似“金字塔”（底部是高分辨率原始图像，向上逐渐变为低分辨率图像）。2.核心作用多尺度分析：不同分辨率的图像适用于检测不同大小的目标（如大目标在低分辨率图像中更易识别，小目标需要高分辨率）。图像融合：结合不同尺度的图像信息（如拉普拉斯金字塔可无缝融合两张图像的细
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C