凌佚

label-studio自动训练模型

文章目录

- 1. 一些补充
- - 1.1 路径修改
  - 1.2 脚本
- 2. 自动训练
- - 2.1 目录结构
  - 2.2 `train.py`
  - 2.3 `model.py`
  - 2.4 训练

1. 一些补充

在本地数据集的自动标注中详细给出了如何在本地部署一个label-studio，并且使用本地某个目录下的数据集进行标注，最后导出，还给出了如何写一个简单的启动bat脚本，以及后端的model.py文件。但是还有一些需要进行优化和补充的地方。

1.1 路径修改

在本地数据集的自动标注的model.py中，限制了best.pt模型的路径是python脚本的同级目录，如果只是进行标注，就不需要进行修改了，但是这篇教程中将要进行自动化模型训练，为了使目录结构清晰，并且方便切换，更改一下路径。在python脚本的同级目录下新建一个model文件夹，专门用于存储用来进行标注的训练好的模型。

./ml_backend_test1/
|-- Dockerfile
|-- README.md
|-- __pycache__
|   |-- model.cpython-312.pyc
|-- _wsgi.py
|-- docker-compose.yml
|-- model
|   |-- best.pt
|-- model.py
|-- requirements-base.txt
|-- requirements-test.txt
|-- requirements.txt
|-- test_api.py
|-- yolo11

对应的代码中将来也需要进行处理。

1.2 脚本

在本地数据集的自动标注中给出了启动label-studio的脚本，这里再给出如何启动一个后端服务的脚本。如启动ml_backend_test1的脚本，脚本需要放在后端的根目录，如c:\dl\label_studio_backend。

按照如下的目录结构：

./label_studio_backend/
|-- cache.db
|-- load_test1_backend.bat
|-- ml_backend_test1

这里的load_test1_backend.bat脚本的内容：

@echo off

:: 打印信息
echo 开始启动 label-studio-ml

:: 配置区域
set CONDA_ENV=label_studio
set BACKEND_NAME=ml_backend_test1
set BACKEND_PORT=9090

:: 激活conda环境
echo.
echo [1/2] 正在激活 Conda 环境 %CONDA_ENV%
call conda activate %CONDA_ENV%

:: 检查激活是否成功
if %errorlevel% neq 0 (
    echo.
    echo 激活 Conda 环境 %CONDA_ENV% 失败！
    echo 请检查是否没有创建这个环境
    pause
    exit /b
)

:: 启动 label-studio-ml
echo.
echo [2/2] 启动 label-studio-ml
label-studio-ml start %BACKEND_NAME% -p %BACKEND_PORT%

:: 检查是否成功启动
if %errorlevel% neq 0 (
    echo.
    echo 启动 label-studio-ml 失败！
    echo 请检查安装情况，或者是否调用错误！
) else (
    echo.
    echo label-studio-ml 运行成功
    echo 可通过地址直接访问: http://localhost:%BACKEND_PORT%
)

:: 保持命令行窗口打开
pause

同样的，Linux下的脚本暂无待补。

2. 自动训练

将两个脚本启动之后，在label-studio的前端洋面，还是在设置页面操作，就可以实现自动化训练了。

最后我们发现最终会调用到model.py中的def fit(self, event, data, **kwargs)函数。

2.1 目录结构

在ml_backend_test1目录下，新建一个yolo11文件夹，这里面将放置我们训练的脚本和最终整理好的数据集。

./yolo11/
|-- datasets
|   |-- training_data_1749458061
|   |-- training_data_1749458247
|   |-- training_data_1749458684
|   |-- training_data_1749458911
|-- train.py
|-- yolo11s.pt

这里的train.py是训练的文件，这里的yolo11s.pt是预训练模型，可以用来我们训练的初始权重，也可以轻易更换为其他的权重。

2.2 `train.py`

train.py的内容如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import argparse
from ultralytics import YOLO


def parse_opt():
    """解析命令行参数"""
    parser = argparse.ArgumentParser()
    parser.add_argument("--weights", type=str, default="", help="初始权重路径")
    parser.add_argument("--cfg", type=str, default="", help="模型.yaml路径")
    parser.add_argument("--data", type=str, default="", help="dataset.yaml路径")
    parser.add_argument("--epochs", type=int, default=100)
    parser.add_argument("--batch_size", type=int, default=16, help="总批量大小")
    parser.add_argument("--imgsz", "--img", "--img-size",
                        type=int, default=640, help="训练/验证图像大小")
    parser.add_argument("--rect", action="store_true", help="矩形训练")
    parser.add_argument("--resume", action="store_true", help="恢复最近的训练")
    parser.add_argument("--nosave", action="store_true", help="仅保存最终检查点")
    parser.add_argument("--noval", action="store_true", help="仅验证最终epoch")
    parser.add_argument(
        "--noautoanchor", action="store_true", help="禁用AutoAnchor")
    parser.add_argument("--evolve", type=int, nargs="?",
                        const=300, help="演化超参数 x代")
    parser.add_argument("--cache", type=str, nargs="?",
                        const="ram", help="图像缓存: 'ram' 或 'disk'")
    parser.add_argument("--image-weights",
                        action="store_true", help="使用加权图像选择进行训练")
    parser.add_argument("--device", default="",
                        help="cuda 设备, 例如 0 或 0,1,2,3 或 cpu")
    parser.add_argument(
        "--multi-scale", action="store_true", help="变化图像大小 +/-50%")
    parser.add_argument("--single-cls", action="store_true", help="训练为单类别数据集")
    parser.add_argument("--optimizer", type=str,
                        choices=["SGD", "Adam"], default="SGD", help="优化器")
    parser.add_argument("--sync-bn", action="store_true",
                        help="使用SyncBatchNorm, 仅适用于DDP训练")
    parser.add_argument("--workers", type=int, default=8, help="最大数据加载器工作进程")
    parser.add_argument("--project", default="runs/train",
                        help="保存项目到 project/name")
    parser.add_argument("--name", default="exp", help="保存项目到 project/name")
    parser.add_argument("--exist-ok", action="store_true",
                        help="现有项目/名称正常, 不递增")
    parser.add_argument("--quad", action="store_true", help="四边形数据加载器")
    parser.add_argument("--linear-lr", action="store_true", help="线性学习率")
    parser.add_argument("--label-smoothing", type=float,
                        default=0.0, help="标签平滑 epsilon")
    parser.add_argument("--patience", type=int, default=100,
                        help="EarlyStopping 耐心 (无改善的epoch)")
    parser.add_argument("--freeze", type=int, default=0, help="冻结层数")
    parser.add_argument("--save_period", type=int,
                        default=-1, help="每x个epoch保存检查点")
    parser.add_argument("--local_rank", type=int,
                        default=-1, help="DDP参数, 请勿修改")
    parser.add_argument("--world_size", type=int,
                        default=1, help="DDP参数, 请勿修改")
    parser.add_argument("--eval_interval", type=int,
                        default=1, help="验证间隔(epoch)")

    # 标签工作室集成参数
    parser.add_argument("--label-studio-url", type=str,
                        default="", help="Label Studio服务器URL")
    parser.add_argument("--label-studio-api-key", type=str,
                        default="", help="Label Studio API密钥")
    parser.add_argument("--update-progress",
                        action="store_true", help="将训练进度发送到Label Studio")

    opt = parser.parse_args()

    return opt


def main(opt, callbacks=None):
    model = YOLO(opt.weights)
    results = model.train(data=opt.data, device=opt.device, project=opt.project, name=opt.name,
                          epochs=opt.epochs, workers=opt.workers, batch=opt.batch_size)


if __name__ == "__main__":
    opt = parse_opt()
    main(opt)

有很多参数都给了默认值，根据自己的需要进行配置。

2.3 `model.py`

然后就是核心的文件model.py，其内容如下：

from typing import List, Dict, Optional
from label_studio_ml.model import LabelStudioMLBase
from label_studio_ml.response import ModelResponse

################## 修改 ##################
# 添加需要的函数
from label_studio_ml.utils import get_image_local_path

# 添加yolo需要的依赖
from ultralytics import YOLO

# 添加额外处理需要的依赖
import re
import time
import datetime
from urllib.parse import unquote
from PIL import Image

# 进程、线程处理
import subprocess
import threading

# 日志
import logging

# 训练
import torch

# 文件处理
from pathlib import Path
import zipfile
import random
import shutil

########################## 一些预定义的参数 ###########################
logger = logging.getLogger(__name__)
script_dir = Path(__file__).resolve().parent
datasets_root_dir = Path('c:/dl/datasets')
project_name = 'test1'
label_studio_url = 'http://localhost:8080'
api_key = 'xxxxxxxxxxxx'


def custom_get_local_path(url):
    try:
        from label_studio_ml.utils import get_image_local_path
        return get_image_local_path(url)
    except:
        pass

    if url.startswith('/data/local-files'):
        # 提取相对路径部分
        match = re.search(r'd=(.*?)(?:&|$)', url)
        if match:
            relative_path = unquote(match.group(1))
            img_path = datasets_root_dir / relative_path
            return img_path

    if url.startswith('/data/upload'):
        relative_path = url.replace('/data/upload/', '').lstrip('/')
        img_path = datasets_root_dir / relative_path
        return img_path

    return url  # 退回原始URL


class NewModel(LabelStudioMLBase):

    def setup(self):
        self.set("model_version", "0.0.1")
        self._model_path = script_dir / 'model' / 'best.pt'
        self._model = YOLO(self._model_path)
        self._labels = self._model.names

        self._is_training = False
        self._training_thread = None
        self._last_trained_model = None
        self._training_process = 0
        self._pretrained_path = self._model_path
        # self._pretrained_path = script_dir / 'yolo11' / 'yolo11s.pt'

        self.config = self.parsed_label_config

    def predict(self,
                tasks: List[Dict],
                context: Optional[Dict] = None,
                **kwargs) -> ModelResponse:
        print(f'''\
        Run prediction on {tasks}
        Received context: {context}
        Project ID: {self.project_id}
        Label config: {self.label_config}
        Parsed JSON Label config: {self.parsed_label_config}
        Extra params: {self.extra_params}''')

        ################## 修改 ##################
        results = []
        for task in tasks:
            image_path = custom_get_local_path(task['data']['image'])
            logger.info(f"图片地址: {image_path}")
            image = Image.open(image_path)
            img_width, img_height = image.size
            pred = self._model(image)
            predictions = []
            for box in pred[0].boxes:
                x_min, y_min, x_max, y_max = map(float, box.xyxy[0].tolist())
                label = self._labels[int(box.cls.item())]
                predictions.append({
                    "from_name": "label",
                    "to_name": "image",
                    "type": "rectanglelabels",
                    "value": {
                        "x": x_min / img_width * 100,
                        "y": y_min / img_height * 100,
                        "width": (x_max - x_min) / img_width * 100,
                        "height": (y_max - y_min) / img_height * 100,
                        "rectanglelabels": [label]
                    },
                    "score": float(box.conf.item())
                })
            results.append({"result": predictions})
        return results
        # return ModelResponse(predictions=[])

    def load_model():
        return None

    def fit(self, event, data, **kwargs):
        if self._is_training:
            logger.info(f"已经有训练任务了，等待完成后再重试！")
            return {"status": "already_training"}

        self._is_training = True
        self._training_process = 0
        self._training_thread = threading.Thread(target=self.train_model,
                                                 args=(data, ))
        self._training_thread.start()

        return {"status": "training_started"}

    def train_model(self, data):
        try:
            logger.info("开始训练YOLO模型...")

            project_id = data['project']['id']
            export_dir = self.export_training_data(project_id)
            classes = self.get_classes_from_config()
            data_yaml = self.create_data_yaml(export_dir, classes)
            self._training_process = 10
            command = self.build_train_command(data_yaml)

            logger.info(f"执行命令: {' '.join(command)}")
            process = subprocess.Popen(
                command,
                stdout=subprocess.PIPE,
                stderr=subprocess.STDOUT,
                universal_newlines=True
            )

            for line in process.stdout:
                logger.info(line.strip())
                if "epoch" in line and "mAP" in line:
                    # 解析进度（示例： Epoch 10/200）
                    parts = line.split()
                    epoch_index = parts.index("epoch")
                    current_epoch = int(parts[epoch_index + 1].split("/")[0])
                    total_epochs = int(parts[epoch_index + 1].split("/")[1])
                    self._training_process = 10 + \
                        int(90 * current_epoch / total_epochs)

            process.wait()

            self._training_process = 95
            new_model_path = self.find_new_model()
            logger.info(f"训练的最新模型: {new_model_path}")
            self._training_process = 100
            logger.info("训练完成！")
        except Exception as e:
            logger.error(f"训练失败: {e}")
        finally:
            self._is_training = False

    def export_training_data(self, project_id):
        from label_studio_sdk import Client

        ls = Client(url=label_studio_url, api_key=api_key)

        project = ls.get_project(project_id)
        export_name =  f'training_data_{int(time.time())}'
        export_dir = script_dir / 'yolo11' / 'datasets' / export_name
        export_file = script_dir / 'yolo11' / 'datasets' / f'{export_name}.zip'

        project.export_tasks(export_type='YOLO',
                             download_all_tasks=True,
                             download_resources=True,
                             export_location=export_file)
        self.convert_export_2_datasets(export_dir, export_file)
        export_file.unlink()
        return export_dir
    
    def convert_export_2_datasets(self, export_dir, export_file):
        f = zipfile.ZipFile(export_file)
        f.extractall(export_dir)
        f.close()

        old_label_path = export_dir / 'labels'
        old_label_files = list(old_label_path.glob('*.txt'))
        new_label_files = []
        for old_file in old_label_files:
            file_name = old_file.name
            print(f"文件名: {file_name}")

            if "%5C" in file_name:
                parts = re.split(r'%5C', file_name, flags=re.IGNORECASE)
                if len(parts) > 1:
                    new_path = old_file.with_name(parts[-1])
                    old_file.rename(new_path)
                    new_label_files.append(new_path.stem)
        
        if len(new_label_files) > 0:
            self.random_datasets(export_dir, new_label_files)
            
    def random_datasets(self, export_dir, label_list, train_ratio=0.8):
        for split in ['train', 'val']:
            for subdir in ['images', 'labels']:
                dst_path = export_dir / subdir / split
                dst_path.mkdir(parents=True)  # 创建新的空文件夹

        random.shuffle(label_list)
        n_total = len(label_list)
        n_train = int(n_total * train_ratio)
        train_list = label_list[:n_train]
        val_list = label_list[n_train:]
        key_map = {"train": train_list, "val": val_list}

        src_img_path = datasets_root_dir / project_name
        img_extension = {'.jpg', '.png', '.jpeg'}
        from collections import defaultdict
        img_map = defaultdict(list)

        for file_path in src_img_path.glob('*'):
            if file_path.is_file():
                ext = file_path.suffix.lower()
                if ext in img_extension:
                    img_map[file_path.stem] = file_path

        for key, files in key_map.items():
            for label_name in files:
                old_label_path = export_dir / 'labels' / f'{label_name}.txt'
                new_label_path = export_dir / 'labels' / key / f'{label_name}.txt'
                old_label_path.replace(new_label_path)
                new_img_path = export_dir / "images" / key
                shutil.copy2(str(img_map[label_name]), str(new_img_path) + "/")

    def get_classes_from_config(self):
        classes = []
        for tag_name, tag_config in self.config.items():
            if tag_config['type'] == 'RectangleLabels':
                classes = tag_config['labels']
                break
        return classes

    def create_data_yaml(self, export_dir, classes):
        train_path = export_dir / 'images' / 'train'
        val_path = export_dir / 'images' / 'val'
        config = {
            'train': str(train_path),
            'val': str(val_path),
            'nc': len(classes),
            'names': classes
        }

        config_path = export_dir / 'data.yaml'
        with open(config_path, 'w') as f:
            f.write(f"train: {config['train']}\n")
            f.write(f"val: {config['val']}\n")
            f.write(f"nc: {config['nc']}\n")
            f.write("names: \n")
            for i, name in enumerate(config['names']):
                f.write(f"  {i}: {name}\n")

        return config_path

    def build_train_command(self, data_yaml):
        train_path = script_dir / 'yolo11' / 'train.py'
        runs_path = script_dir / 'yolo11' / 'runs' / 'train'
        base_command = [
            "python", str(train_path), "--batch_size", "16", "--epochs", "100",
            "--data", str(data_yaml), "--device",
            "0" if torch.cuda.is_available() else "cpu", "--project",
            str(runs_path), "--name", f"yolo11_{int(time.time())}"
        ]

        base_command.extend(["--weights", str(self._pretrained_path)])
        return base_command

    def find_new_model(self):
        runs_dir = script_dir / 'yolo11' / 'runs' / 'train'
        if not runs_dir.exists():
            logger.error(f"目录不存在: {runs_dir}")
            return None
        best_pt_files = list(runs_dir.rglob('best.pt'))

        if not best_pt_files:
            logger.error(f"在 {runs_dir} 及其子目录中未找到 best.pt 文件")
            return None

        file_info = []
        for file_path in best_pt_files:
            try:
                stat = file_path.stat()
                ctime = datetime.datetime.fromtimestamp(stat.st_ctime)
                mtime = datetime.datetime.fromtimestamp(stat.st_mtime)

                file_info.append({
                    'path': file_path,
                    'ctime': ctime,  # 创建时间
                    'mtime': mtime,  # 修改时间
                    'size': stat.st_size,
                    'experiment': file_path.parent.name,
                    'experiment_path': file_path.parent
                })
            except OSError as e:
                logger.error(f"无法访问文件 {file_path}: {e}")

        file_info.sort(key=lambda x: x['ctime'], reverse=True)
        latest_file = file_info[0]
        print(f"找到 {len(file_info)} 个 best.pt 文件:")
        for i, info in enumerate(file_info[:5], 1):  # 只显示前5个
            print(
                f"{i}. {info['path']} - 创建于: {info['ctime']} - 大小: {info['size']/1024**2:.2f} MB")

        print("\n" + "=" * 70)
        print(f"最新 best.pt 文件: {latest_file['path']}")
        print(f"  创建时间: {latest_file['ctime']}")
        print(f"  修改时间: {latest_file['mtime']}")
        print(f"  文件大小: {latest_file['size']/1024**2:.2f} MB")
        print(f"  所属实验: {latest_file['experiment']}")
        print(f"  实验路径: {latest_file['experiment_path']}")
        print("=" * 70)

        return latest_file['path']

    def get_train_status(self):
        """获取训练状态（用于API查询）"""
        return {
            "is_training": self._is_training,
            "process": self._training_process,
            "last_trained_model": self._last_trained_model
        }

简单做一些说明：

def fit(self, event, data, **kwargs):

在函数中创建了一个线程，去调用train_model函数进行处理。

def train_model(self, data):

在函数中实现训练，包括准备训练数据、执行训练的命令和输出实时输出结果。

最终是调用子进程来实现训练，也就是调用train.py！
def export_training_data(self, project_id):

函数中实现从label-studio上下载标注后的数据，但是，label-studio中没有提供同时下载图片和标签的接口，所以需要做了一些额外处理，这也是文件的初始全局变量的作用：
script_dir = Path(__file__).resolve().parent 
datasets_root_dir = Path('c:/dl/datasets')
project_name = 'test1'
label_studio_url = 'http://localhost:8080'
api_key = 'xxxxxx'
需要处理文件的重命名、训练测试集分类、拷贝文件等。
def create_data_yaml(self, export_dir, classes):

创建一个yaml文件来描述训练数据。

def build_train_command(self, data_yaml):

构建训练的命令，来调用train.py。

都准备好了之后就可以开始自动训练了。

2.4 训练

按照前面将文件准备好了之后，重新启动后端，然后在前端点击Start Training之后，就可以看到开始训练了，等待足够长时间后就可以得到：

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
淘宝内部优惠劵领取教程，淘宝内部优惠劵软件使用方法！测评君高省
淘宝优惠券一般分为2种：第1种：是你在淘宝上买东西经常能看到的那种店铺优惠券，商家主动将一些有门槛的优惠券摆在旁边，这种券一般需要你满足消费金额或者去邀请好友才能减个几块钱。第2种：就是淘宝内部优惠券，商家为了打造爆款时会低价促销从而发放一些低价优惠券，只要下单就能立减，而且优惠的金额都非常高。但是为了控制成本并设置一定的销售目标，一旦达成预订销售额，就会停止发送优惠券。优惠劵导购平台哪个好？今天
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23