AIGC应用创新大全

实时姿态估计：MediaPipe人体关键点检测实战教程

关键词：实时姿态估计、MediaPipe、人体关键点检测、BlazePose、计算机视觉

摘要：本文将带你从0到1掌握MediaPipe人体关键点检测技术。我们会用“给人体贴标记”的生活比喻解释核心概念，通过Python代码实战演示如何在5分钟内实现实时姿态估计，并结合健身动作分析、AR互动等真实场景，帮你理解这项技术的底层逻辑和应用价值。无论你是刚入门的AI爱好者还是需要快速落地的开发者，都能从这篇教程中找到答案。

背景介绍

目的和范围

你是否好奇过：抖音里的“动态贴纸”是如何精准追踪你的肩膀和手肘？健身APP是怎样判断你做的深蹲是否标准？这些功能的核心技术，就是实时姿态估计。本文将聚焦“人体关键点检测”这一细分领域，通过Google开源的MediaPipe框架，教你用最简单的代码实现实时姿态检测，并理解其背后的技术原理。

预期读者

对计算机视觉感兴趣的新手（会基础Python即可）
需要快速落地姿态检测功能的开发者（如健身APP、AR应用开发）
想了解MediaPipe框架的技术爱好者

文档结构概述

本文将按照“概念解释→原理拆解→代码实战→场景应用”的逻辑展开：先用生活案例讲清“姿态估计”和“MediaPipe”是什么；再拆解MediaPipe的核心模型BlazePose；接着用Python代码手把手带你跑通实时检测；最后结合实际场景说明这项技术的价值。

术语表

核心术语定义

姿态估计（Pose Estimation）：从图像/视频中识别出人体关键点（如肩、肘、腕）的位置，并用连线表示骨骼结构的技术。
关键点检测（Keypoint Detection）：识别并定位人体特定部位（如左眼、右膝）的坐标，通常输出N个关键点的(x,y)坐标。
MediaPipe：Google开源的跨平台框架，提供预训练的AI模型和高效的数据流处理模块，能快速实现姿态、手势等检测功能。

核心概念与联系

故事引入：给人体贴“导航标签”

想象你是一个画家，要给一张人物照片画骨骼图。你需要先找到“左肩”“右肘”“左膝”这些关键位置，再用线条把它们连起来。但手动做这件事又慢又容易出错——这时候，AI就像一个“超级画家助手”，能快速帮你找到这些关键点，并自动连线。
MediaPipe的人体关键点检测，就是这样一个“超级助手”：它能在手机、电脑甚至摄像头里，实时给视频中的人体贴上54个“导航标签”（33个身体关键点+21个面部关键点？不，MediaPipe姿态模型是33个身体关键点），并画出骨骼线。

核心概念解释（像给小学生讲故事一样）

核心概念一：人体关键点（Keypoints）
你玩过“大家来找茬”游戏吗？人体关键点就像人体的“特征标记”。比如：

眼睛（左眼、右眼）是脸部的关键点；
肩膀（左肩、右肩）是上半身的关键点；
膝盖（左膝、右膝）是下半身的关键点。
MediaPipe能检测33个这样的关键点（比如“左腕”“右臀”），每个点都有唯一的编号（0-32），就像给每个关键点发了一张“身份证”。

核心概念二：实时姿态估计（Real-time Pose Estimation）
假设你在看动画片，每一帧画面都是一张照片。实时姿态估计就像“动画师”，能快速处理每一帧照片：先找到这一帧的33个关键点，再根据前后帧的关键点变化，画出流畅的骨骼动画。这个过程要快到“和你眨眼睛一样快”（每秒处理24帧以上），否则画面会卡顿。

核心概念三：MediaPipe框架
MediaPipe就像一个“万能工具箱”，里面装好了各种“AI工具”：

有专门“找人脸”的工具（人脸检测）；
有专门“看手势”的工具（手势识别）；
我们今天用的是“找人体关键点”的工具（姿态检测）。
这个工具箱最厉害的地方是：它能把这些工具“组装”起来，比如同时做人脸+姿态检测，而且运行速度还很快！

核心概念之间的关系（用小学生能理解的比喻）

关键点检测是姿态估计的“地基”：要画骨骼图，必须先找到关键点，就像盖房子要先打地基。
MediaPipe是“施工队”：它提供了预训练好的“找关键点”模型（相当于盖房子的“图纸”）和高效的计算流程（相当于“施工步骤”），让我们不用自己从头造工具。
实时性是“验收标准”：无论用多好的工具，如果处理速度太慢（比如每秒只能处理5帧），就没法用在手机或摄像头里，所以MediaPipe的设计目标就是“又快又准”。

核心概念原理和架构的文本示意图

MediaPipe姿态检测的核心流程可以概括为：
输入图像 → 预处理（缩放、归一化） → 关键点检测模型（BlazePose）推理 → 后处理（坐标转换、置信度过滤） → 输出33个关键点坐标 + 骨骼连线。

Mermaid 流程图

graph TD
    A[输入图像/视频流] --> B[图像预处理]
    B --> C[BlazePose模型推理]
    C --> D[关键点坐标解码]
    D --> E[置信度过滤（去掉不可信的点）]
    E --> F[输出33个关键点坐标+骨骼连线]

核心算法原理 & 具体操作步骤

MediaPipe的姿态检测主要依赖BlazePose模型，这是Google为移动端优化的轻量级姿态估计模型。它的核心设计思路是“又快又准”：既要有足够的精度检测关键点，又要能在手机等低算力设备上实时运行。

BlazePose模型的“三板斧”

轻量级主干网络：用类似MobileNet的轻量级CNN（卷积神经网络）提取图像特征，就像用“高效筛子”过滤出人体的关键信息。
多任务预测头：模型同时输出3部分信息：
- 33个关键点的(x,y)坐标（在图像中的位置）；
- 每个关键点的置信度（0-1分，分数越高越可信）；
- 人体的旋转矩阵（用于3D姿态估计，2D检测暂时用不到）。
注意力机制：模型会重点关注人体区域（比如用分割模型先框出人体），避免被背景干扰，就像你考试时会重点看题目里的关键词。

用Python调用MediaPipe的核心步骤（代码示例）

我们以最常用的Python版本MediaPipe为例，演示如何实现实时姿态检测。

步骤1：安装依赖库

打开终端，输入以下命令安装必要的库（需要Python 3.7+环境）：

pip install mediapipe opencv-python

mediapipe：Google官方的姿态检测库；
opencv-python：用于读取摄像头/视频并显示画面。

步骤2：编写核心检测代码

import cv2
import mediapipe as mp

# 初始化MediaPipe姿态检测模块
mp_pose = mp.solutions.pose
mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点和连线的工具

# 配置姿态检测参数（静态图像模式设为False，用于视频流）
pose = mp_pose.Pose(
    static_image_mode=False,  # 视频流模式（比静态图像模式快）
    model_complexity=1,       # 模型复杂度（0:轻量，1:平衡，2:高精度）
    min_detection_confidence=0.5,  # 检测置信度阈值（低于0.5则认为检测失败）
    min_tracking_confidence=0.5    # 追踪置信度阈值
)

# 读取摄像头（0代表电脑内置摄像头，也可以替换为视频文件路径）
cap = cv2.VideoCapture(0)

while cap.isOpened():
    success, image = cap.read()
    if not success:
        print("无法读取摄像头，请检查设备！")
        break

    # 转换图像颜色空间（MediaPipe需要RGB格式，OpenCV默认是BGR）
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    # 运行姿态检测
    results = pose.process(image_rgb)

    # 如果检测到姿态，绘制关键点和连线
    if results.pose_landmarks:
        # 绘制33个关键点（用紫色圆圈标记）
        mp_drawing.draw_landmarks(
            image,
            results.pose_landmarks,
            mp_pose.POSE_CONNECTIONS,  # 预定义的骨骼连线（如肩-肘-腕）
            landmark_drawing_spec=mp_drawing.DrawingSpec(
                color=(255, 0, 255),  # 关键点颜色（BGR格式：紫）
                thickness=2, 
                circle_radius=4
            ),
            connection_drawing_spec=mp_drawing.DrawingSpec(
                color=(0, 255, 0),    # 连线颜色（BGR格式：绿）
                thickness=2
            )
        )

    # 显示处理后的图像
    cv2.imshow('MediaPipe Pose Detection', image)
    # 按q键退出
    if cv2.waitKey(5) & 0xFF == ord('q'):
        break

# 释放资源
pose.close()
cap.release()
cv2.destroyAllWindows()

代码逐行解读

第5-12行：初始化姿态检测模块。model_complexity参数是关键：
- 0：适合手机等低算力设备，速度最快但精度稍低；
- 1：平衡模式，大多数场景推荐；
- 2：高精度模式，适合对关键点精度要求高的场景（如医疗分析）。
第15行：读取摄像头。如果你的电脑有多个摄像头（比如外接摄像头），可以尝试cap = cv2.VideoCapture(1)。
第20行：转换颜色空间。因为OpenCV读取的图像是BGR格式（蓝-绿-红），而MediaPipe的模型需要RGB格式（红-绿-蓝），所以必须转换。
第22行：运行姿态检测。results.pose_landmarks是检测到的关键点数据，包含33个点的坐标和置信度。
第25-40行：绘制关键点和连线。POSE_CONNECTIONS是MediaPipe预定义的骨骼连接规则（比如左肩连左肘，左肘连左腕），这样就能画出完整的骨骼图。

数学模型和公式 & 详细讲解 & 举例说明

关键点坐标的数学表示

每个关键点的坐标用landmark.x和landmark.y表示，取值范围是[0,1]，代表相对于图像宽高的比例坐标。例如：

如果图像宽度是640像素，高度是480像素，且某个关键点的x=0.5，y=0.5，则实际像素坐标是：
$x_{像素} = 0.5 \times 640 = 320$
$y_{像素} = 0.5 \times 480 = 240$

置信度的作用

每个关键点有一个置信度landmark.visibility（0-1分），表示模型对该点位置的信心。例如：

如果某个人的手臂被遮挡，模型可能对“腕部关键点”的置信度只有0.3（低于我们设置的min_detection_confidence=0.5），这时候可以忽略这个点，避免绘制错误的位置。

损失函数：如何让模型“越练越准”

BlazePose模型训练时，用的是均方误差（MSE）损失函数来优化关键点坐标的预测精度。公式如下：
$\frac{1}{N} \sum_{i=1}^{N} (x_{预测}^{(i)} - x_{真实}^{(i)})^2 + (y_{预测}^{(i)} - y_{真实}^{(i)})^2$
其中， $N$ 是关键点数量（33）， $x_{预测}^{(i)}$ 是第 $i$ 个关键点的预测x坐标， $x_{真实}^{(i)}$ 是真实标注的x坐标（同理y坐标）。模型通过调整参数，让预测值尽可能接近真实值，从而减少损失 $L$ 。

项目实战：代码实际案例和详细解释说明

开发环境搭建

如果你是第一次运行这个代码，可能需要注意以下几点：

Python版本：推荐Python 3.8-3.10（MediaPipe对高版本Python支持可能不稳定）。
摄像头权限：运行代码时，系统可能会提示“允许访问摄像头”，需要点击“允许”。
显卡加速：如果想提升运行速度，可以安装CUDA（NVIDIA显卡）或MPS（Apple Silicon芯片），但MediaPipe默认会自动使用GPU加速（如果可用）。

源代码详细实现和代码解读

前面的代码已经实现了基础的实时姿态检测，但我们可以添加一些“进阶功能”让它更有趣，比如：

显示当前FPS（每秒处理帧数）；
打印某个关键点的坐标（如右肩）；
检测特定动作（如抬手）。

进阶代码示例：显示FPS和右肩坐标

import cv2
import mediapipe as mp
import time  # 用于计算FPS

mp_pose = mp.solutions.pose
mp_drawing = mp.solutions.drawing_utils

pose = mp_pose.Pose(static_image_mode=False, model_complexity=1)
cap = cv2.VideoCapture(0)

prev_time = 0  # 上一帧的时间戳

while cap.isOpened():
    success, image = cap.read()
    if not success:
        break

    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    results = pose.process(image_rgb)

    # 计算FPS
    current_time = time.time()
    fps = 1 / (current_time - prev_time)
    prev_time = current_time

    # 在画面上显示FPS
    cv2.putText(
        image, 
        f"FPS: {int(fps)}", 
        (10, 30),  # 文字位置（x=10, y=30）
        cv2.FONT_HERSHEY_SIMPLEX, 
        1,         # 字体大小
        (0, 255, 0),  # 颜色（绿）
        2          # 字体粗细
    )

    if results.pose_landmarks:
        # 打印右肩（关键点编号11）的坐标
        right_shoulder = results.pose_landmarks.landmark[mp_pose.PoseLandmark.RIGHT_SHOULDER]
        print(f"右肩坐标（比例）: x={right_shoulder.x:.2f}, y={right_shoulder.y:.2f}")

        # 绘制关键点和连线
        mp_drawing.draw_landmarks(
            image,
            results.pose_landmarks,
            mp_pose.POSE_CONNECTIONS,
            landmark_drawing_spec=mp_drawing.DrawingSpec(color=(255,0,255), thickness=2, circle_radius=4),
            connection_drawing_spec=mp_drawing.DrawingSpec(color=(0,255,0), thickness=2)
        )

    cv2.imshow('MediaPipe Pose', image)
    if cv2.waitKey(5) & 0xFF == ord('q'):
        break

pose.close()
cap.release()
cv2.destroyAllWindows()

代码解读与分析

FPS计算：通过time.time()获取当前时间戳，用1除以两帧的时间差得到FPS，这样可以实时显示处理速度（正常应该在20-30 FPS之间）。
关键点编号：MediaPipe的PoseLandmark枚举类定义了33个关键点的编号，例如RIGHT_SHOULDER对应编号11，LEFT_ELBOW对应编号13。你可以通过dir(mp_pose.PoseLandmark)查看所有关键点名称。
坐标打印：right_shoulder.x和right_shoulder.y是比例坐标（0-1），如果需要转换为像素坐标，可以用x_px = int(right_shoulder.x * image.shape[1])（image.shape[1]是图像宽度）。

实际应用场景

场景1：健身动作矫正

健身APP可以通过检测关键点，判断用户的动作是否标准。例如：

深蹲时，膝盖是否超过脚尖（检测膝、踝关键点的位置关系）；
俯卧撑时，肩、肘、腕是否在一条直线上（检测肩、肘、腕的x坐标是否接近）。

场景2：AR互动游戏

抖音的“动态贴纸”可以根据肩部关键点的位置，在用户肩膀上“放”一只虚拟宠物；或者根据手肘的角度，让虚拟篮球“跟着”用户的手臂动作抛出。

场景3：安防监控

通过检测人体姿态（如摔倒时的“平躺”姿态），可以自动触发警报，用于老人独居监护或公共区域安全监控。

工具和资源推荐

官方文档：MediaPipe Pose Documentation（包含参数说明和C++/Python示例）。
关键点编号图：MediaPipe Pose Landmarks（33个关键点的可视化标注图）。
模型论文：BlazePose: On-device Real-time Body Pose tracking（想深入了解模型原理可以读这篇论文）。
扩展工具：cvzone库（基于OpenCV和MediaPipe的简化工具包，适合快速开发姿态相关应用）。

未来发展趋势与挑战

趋势1：多人体姿态检测

当前MediaPipe主要支持单人体检测，未来可能会优化多人体场景（比如课堂里同时检测30个学生的姿态）。

趋势2：3D姿态估计的轻量化

3D姿态能提供更丰富的信息（如关节的深度），但现有模型计算量较大。未来可能会出现更轻量的3D姿态模型，适用于手机端。

挑战1：遮挡与复杂背景

当人体部分被遮挡（如手臂交叉）或背景复杂（如人群密集）时，关键点检测的精度会下降，需要模型具备更强的鲁棒性。

挑战2：边缘设备优化

虽然MediaPipe已经很高效，但在低算力设备（如树莓派）上运行高精度模型时，仍可能出现卡顿，需要进一步优化模型压缩和推理加速技术。

总结：学到了什么？

核心概念回顾

人体关键点：33个标记人体关键部位的“导航点”（如肩、肘、膝）。
实时姿态估计：快速检测视频中每一帧的关键点，画出骨骼图。
MediaPipe：Google的“万能工具箱”，提供预训练模型和高效流程，让姿态检测变得简单。

概念关系回顾

关键点检测是姿态估计的基础，MediaPipe是实现实时姿态估计的“工具”。
通过调整MediaPipe的参数（如model_complexity），可以在速度和精度之间做权衡。

思考题：动动小脑筋

如果你想检测一个人是否“举手”（比如课堂上回答问题），应该观察哪些关键点？如何用代码判断？（提示：比较手肘和肩部的y坐标）
MediaPipe的model_complexity设为0、1、2时，分别适合什么场景？你可以修改代码中的这个参数，观察FPS和关键点精度的变化吗？
除了摄像头，你还能让代码读取视频文件吗？尝试将cv2.VideoCapture(0)改为cv2.VideoCapture("test.mp4")（需要准备一个测试视频），看看效果如何。

附录：常见问题与解答

Q：运行代码时提示“ModuleNotFoundError: No module named ‘mediapipe’”怎么办？
A：这是因为没有安装mediapipe库。请在终端输入pip install mediapipe（如果是Mac M1芯片，可能需要用pip install mediapipe-silicon）。

Q：画面卡顿，FPS只有10左右，怎么优化？
A：可以尝试：

降低model_complexity（设为0）；
调整摄像头分辨率（cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)，cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)）；
确保使用GPU加速（如果有NVIDIA显卡，安装CUDA后MediaPipe会自动使用）。

Q：检测不到人体怎么办？
A：可能是因为：

图像太暗（尝试在明亮环境中测试）；
人体太小（离摄像头远一些，让人体占满画面）；
min_detection_confidence设得太高（可以尝试降到0.3）。

扩展阅读 & 参考资料

《计算机视觉：算法与应用》（Richard Szeliski著，经典计算机视觉教材）。
MediaPipe官方GitHub仓库（包含最新代码和示例）。
OpenCV官方文档（学习图像视频处理的必备资料）。

英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
重复文件清理工具，附免费链接 mixiumixiu 其他
链接:https://pan.baidu.com/s/1s_Zx1eHp5Y-XnbbGldIgvw?pwd=kjex提取码:kjex复制这段内容后打开百度网盘手机App，操作更方便哦
【三桥君】AI技术发展下，单智能体局限性凸显，如何通过MCP和A2A协议实现智能体团队协作转变？
你好，我是✨三桥君✨本文介绍>>一、引言在AI技术突飞猛进的今天，单智能体的局限性正日益暴露，而智能体（AIAgents）协作已然成为不可逆转的趋势。你是否曾思考过，如何通过MCP和A2A协议实现智能体从单兵作战到团队协作的革命性转变？本文三桥君将深入探讨MCP和A2A协议的核心功能与优势，帮助你全面理解智能体协作的无限可能。二、A2A与MCP协议作用MCP（ModelControlProtoco
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
[Ljava.lang.Object; cannot be cast to [Ljava.lang.String; 这些不会的
解释：这个错误是很常见的错误，错误的提示已经很清楚了就是java的Object数组不能转换成为String[]数组，这就说明你要转换的数组它本身是Object类型的数组，但是你却非要把它转换为String类的数组，这当然是错误的。示例：[java]viewplaincopypackagecom.dada;importjava.util.ArrayList;importjava.util.List;
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

实时姿态估计：MediaPipe人体关键点检测实战教程