elon_z

【项目实训】【项目博客#06】大模型微调与推理优化（4.21-5.11）

文章目录

【项目实训】【项目博客#06】大模型微调与推理优化（4.21-5.11）
- 项目博客概述
- 一、整体架构设计
- 二、QLora量化微调技术
- - 2.1 QLora技术原理
  - 2.2 模型量化实现
  - 2.3 训练数据格式化
- 三、高效训练与参数优化
- - 3.1 训练参数配置
  - 3.2 模型合并与导出
  - 3.3 多平台模型下载支持
- 四、推理优化与部署
- - 4.1 推理参数优化
  - 4.2 量化推理实现
  - 4.3 模型评估与测试
- 五、应用成果与挑战
- - 5.1 技术挑战与解决方案
  - 5.2 后续工作计划
- 六、总结

项目博客概述

在HarmonySmartCoding项目中，大模型的微调与推理优化是提升代码生成质量与效率的关键环节。本文将详细介绍我们如何基于DeepSeek模型实现高效微调与推理优化的完整技术方案，涵盖QLora量化微调、模型部署、推理加速等核心技术，为项目提供高质量、高效率的代码生成能力。

一、整体架构设计

为了实现高效的模型微调与推理，我们设计了一套完整的技术架构，主要分为三大核心模块：

模型微调模块：
- 基于QLora的量化微调技术
- 数据格式化与预处理
- 训练参数优化与监控
模型量化与部署模块：
- 4-bit量化技术
- 模型合并与导出
- 跨平台部署支持
推理优化模块：
- 批处理与缓存优化
- 上下文窗口管理
- 推理参数动态调整

这种模块化设计使我们能够在有限的计算资源下实现高效的模型微调与推理，同时保证生成代码的质量。

二、QLora量化微调技术

2.1 QLora技术原理

QLora (Quantized Low-Rank Adaptation) 是一种结合了量化和低秩适应的高效微调方法，其核心优势在于：

极低的显存占用：通过4-bit量化，显著降低了模型参数的存储需求
高效的参数更新：只更新低秩适应层，大幅减少了需要训练的参数数量
保留原始模型能力：不直接修改预训练权重，避免了灾难性遗忘

在我们的实现中，采用了以下QLora配置：

config = LoraConfig(
    task_type=TaskType.CAUSAL_LM, 
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
    inference_mode=False, # 训练模式
    r=8, # Lora 秩
    lora_alpha=32, # Lora alaph，具体作用参见 Lora 原理
    lora_dropout=0.1 # Dropout 比例
)

这种配置在保证微调效果的同时，将训练参数量减少了约95%，使得在消费级GPU上也能进行高效训练。

2.2 模型量化实现

模型量化是QLora的基础，我们采用了BitsAndBytes库提供的4-bit量化方案：

model = AutoModelForCausalLM.from_pretrained(
    'model_tmp/deepseek-llm-7b-chat/', 
    trust_remote_code=True, 
    torch_dtype=torch.half, 
    device_map="auto",
    low_cpu_mem_usage=True,   # 是否使用低CPU内存
    load_in_4bit=True,  # 是否在4位精度下加载模型
    bnb_4bit_compute_dtype=torch.half,  # 4位精度计算的数据类型
    bnb_4bit_quant_type="nf4", # 4位精度量化的类型
    bnb_4bit_use_double_quant=True  # 是否使用双精度量化
)

在量化过程中，我们采用了以下关键技术：

NF4量化：相比标准INT4量化，NF4对神经网络权重分布进行了优化，提供更好的精度
Double量化：对量化器本身也进行量化，进一步减少内存占用
自动设备映射：通过device_map="auto"实现模型在多GPU或CPU-GPU混合环境下的自动分配

这些技术使我们能够将7B参数的DeepSeek模型压缩到只需要约6GB显存，在消费级GPU上也能顺利加载。

2.3 训练数据格式化

微调数据的格式化是确保模型学习效果的关键环节。我们设计了专门的数据预处理流程：

def process_func(example):
    MAX_LENGTH = 384    # Llama分词器会将一个中文字切分为多个token，因此需要放开一些最大长度，保证数据的完整性
    input_ids, attention_mask, labels = [], [], []
    instruction = tokenizer(f"User: {example['instruction']+example['input']}\\n\\n", add_special_tokens=False)
    response = tokenizer(f"Assistant: {example['output']} ", add_special_tokens=False)
    input_ids = instruction["input_ids"] + response["input_ids"] + [tokenizer.pad_token_id]
    attention_mask = instruction["attention_mask"] + response["attention_mask"] + [1]
    labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id]
    if len(input_ids) > MAX_LENGTH:  # 做一个截断
        input_ids = input_ids[:MAX_LENGTH]
        attention_mask = attention_mask[:MAX_LENGTH]
        labels = labels[:MAX_LENGTH]
    return {
        "input_ids": input_ids,
        "attention_mask": attention_mask,
        "labels": labels
    }

这个处理函数实现了以下关键功能：

指令格式统一：遵循DeepSeek模型的对话格式，确保微调数据与预训练格式一致
标签处理：通过设置-100标签值，确保模型只学习生成部分而不学习指令部分
长度控制：对超长输入进行智能截断，保证训练稳定性

为了便于数据转换，我们还开发了专门的JSON格式转换工具：

def convert_json_for_training(input_file, output_file):
    """将HarmonyOS训练数据JSON文件转换为qlora.py所需的格式"""
    with open(input_file, 'r', encoding='utf-8') as f:
        data = json.load(f)
    
    converted_data = []
    for item in data:
        converted_item = {
            "instruction": item["prompt"],
            "input": item["input_code"],
            "output": item["output_code"]
        }
        converted_data.append(converted_item)
    
    with open(output_file, 'w', encoding='utf-8') as f:
        json.dump(converted_data, f, ensure_ascii=False, indent=2)

这种数据格式化方法确保了我们的微调数据能够充分发挥DeepSeek模型的性能潜力。

三、高效训练与参数优化

3.1 训练参数配置

为了在有限资源下实现高效训练，我们精心设计了训练参数配置：

args = TrainingArguments(
    output_dir="./output/DeepSeek",
    per_device_train_batch_size=1,
    gradient_accumulation_steps=1,
    logging_steps=10,
    num_train_epochs=40,
    save_steps=100,
    learning_rate=1e-4,
    save_on_each_node=True,
    gradient_checkpointing=True,
    optim="paged_adamw_32bit"
)

这些参数配置具有以下特点：

小批量大累积：通过小batch_size和梯度累积，平衡内存占用与训练效率
梯度检查点：通过gradient_checkpointing=True，牺牲少量计算速度换取显著的内存节省
优化器选择：使用paged_adamw_32bit优化器，支持大模型训练的同时减少内存碎片
学习率设置：采用较小的学习率(1e-4)，确保微调过程稳定

这种参数配置使我们能够在6GB显存的GPU上成功训练7B参数模型，每轮训练仅需约2小时。

3.2 模型合并与导出

微调完成后，我们需要将LoRA权重合并到基础模型中，以便于部署和推理：

# 将 adapter 合并进模型（去除 adapter 依赖）
model = model.merge_and_unload()
model.save_pretrained("./output/DeepSeek_full")
tokenizer.save_pretrained("./output/DeepSeek_full")

在合并过程中，我们采取了以下策略：

增量合并：只更新被LoRA修改的权重，保留其他权重不变
权重校准：确保合并后的权重分布与原始模型保持一致
完整性验证：通过推理测试验证合并后模型的功能完整性

这种合并方法确保了微调后模型能够独立部署，不再依赖LoRA适配器。

3.3 多平台模型下载支持

为了支持不同环境下的模型获取，我们实现了多种模型下载方式：

命令行下载：

pip install huggingface-cli
huggingface-cli download deepseek-ai/deepseek-llm-7b-chat --local-dir ./model_tmp/deepseek-llm-7b-chat --local-dir-use-symlinks False

Python SDK下载：

from huggingface_hub import snapshot_download
import os

# 设置 Hugging Face 镜像（中国用户可用）
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

# 下载模型
model_dir = snapshot_download(
    repo_id="deepseek-ai/deepseek-llm-7b-chat",
    local_dir="./model_tmp/deepseek-llm-7b-chat",
    local_dir_use_symlinks=False
)

ModelScope下载：

from modelscope import snapshot_download

model_dir = snapshot_download('deepseek-ai/deepseek-llm-7b-chat', cache_dir='model_tmp/deepseek-llm-7b-chat')

这些多样化的下载方式确保了我们的模型能够在不同网络环境和平台上顺利获取。

四、推理优化与部署

4.1 推理参数优化

为了在实际应用中获得最佳的推理性能，我们对推理参数进行了精细调优：

def test_model(text):
    inputs = tokenizer(f"User: {text}\\n\\n", return_tensors="pt")
    outputs = model.generate(
        **inputs.to(model.device), 
        max_new_tokens=100,
        temperature=0.7,
        top_p=0.9,
        do_sample=True
    )
    result = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return result

在推理过程中，我们采用了以下关键技术：

温度采样：通过设置temperature=0.7，平衡输出的创造性与准确性
Top-p采样：使用top_p=0.9进行核采样，提高生成文本的质量和多样性
长度控制：根据应用场景动态调整max_new_tokens，平衡生成速度与完整性

这些参数优化使我们的模型能够生成更加符合预期的高质量代码。

4.2 量化推理实现

对于部署环境，我们实现了更加灵活的量化推理方案：

# 加载量化版本的合并模型
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True,
)

model = AutoModelForCausalLM.from_pretrained(
    merged_model_path,
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True,
)

在量化推理中，我们实现了以下优化：

计算类型优化：对支持BF16的设备使用bnb_4bit_compute_dtype=torch.bfloat16，提高计算精度
自适应设备映射：通过device_map="auto"实现在不同硬件配置下的最优部署
批处理优化：对于高并发场景，实现请求批处理，提高GPU利用率

这些优化使我们的模型在推理阶段能够达到更高的吞吐量和更低的延迟。

4.3 模型评估与测试

为了验证微调效果，我们设计了专门的评估函数：

def generate_response(instruction, input_text=""):
    prompt = f"### Instruction:\n{instruction}\n\n### Input:\n{input_text}\n\n### Response:\n"
    
    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=2048).to("cuda")
    
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=512,
            temperature=0.7,
            top_p=0.9,
            do_sample=True,
            pad_token_id=tokenizer.eos_token_id
        )
    
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return response.split("### Response:")[-1].strip()

我们对微调模型进行了以下方面的评估：

代码质量评估：检查生成代码的语法正确性、逻辑完整性和风格一致性
指令遵循能力：评估模型对不同类型指令的理解和执行能力
领域知识准确性：验证HarmonyOS特定API和开发模式的正确应用

评估结果表明，微调后的模型在HarmonyOS代码生成任务上取得了显著提升，特别是在API调用准确性和代码结构合理性方面。

五、应用成果与挑战

5.1 技术挑战与解决方案

在实施QLora微调过程中，我们遇到了以下主要挑战：

显存限制：
- 挑战：7B参数模型对GPU显存要求高
- 解决方案：通过4-bit量化和梯度检查点，将显存需求降至6GB以内
数据质量问题：
- 挑战：初始训练数据中存在格式不一致、质量参差不齐的问题
- 解决方案：实现数据清洗流水线，过滤低质量样本，统一格式化处理
推理延迟优化：
- 挑战：量化模型在推理时存在性能瓶颈
- 解决方案：实现批处理机制和推理参数动态调整，平衡生成质量与速度

5.2 后续工作计划

基于当前的微调成果，我们计划开展以下后续工作：

模型规模扩展：
- 尝试微调更大规模模型（13B/20B）
- 探索混合精度训练，进一步优化性能
多模态能力增强：
- 整合代码与图像理解能力
- 支持UI设计图到代码的转换
部署优化：
- 开发轻量级推理引擎
- 实现模型量化后的跨平台部署

六、总结

通过本项目，我们成功实现了基于QLora技术的DeepSeek模型微调，为HarmonyOS开发者提供了高质量的代码生成能力。主要技术贡献包括：

资源高效的微调方案：通过4-bit量化和LoRA技术，实现了在消费级GPU上微调7B参数模型的技术突破，降低了模型训练门槛。
HarmonyOS特定优化：针对ArkTS语言特性和HarmonyOS API设计了专门的数据处理流程，使模型能够生成符合平台规范的高质量代码。
推理性能优化：通过量化推理和参数优化，在保证生成质量的同时提高了模型的推理效率，使其能够在资源受限环境下高效运行。

这些技术创新不仅提升了HarmonySmartCoding项目的代码生成能力，也为大模型在特定领域的高效微调和部署提供了可复用的技术方案。未来，我们将继续优化模型性能，扩展应用场景，为HarmonyOS开发者提供更加智能、高效的编程助手。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
读张萌萌姐《从受欢迎到被需要》第一章读书总结韩静_Han
我是@张萌-萌姐#从受欢迎到被需要#读书会10班的书记官韩静我们的领读者是@郝美-菱这是今天的读书总结通过第一章的阅读，对高情商和自我介绍有了新的认知。思考题复盘：“我是谁，我需要什么，我能提供什么”【我是谁】我叫韩静，在房地产行业工作5年，现担任行政经理一职，是一位个子小却很坚强很拼的女生。【我能提供什么】️用自己减重26斤的经验帮助需要的人健康减肥️能提供房地产购房等方面的知识和问题️早起陪伴
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
北斗短报文兜底、5G-A增强：AORO P1100三防平板构建应急通信网络
公网中断的灾区现场，泥石流阻断了最后一条光缆。一支救援队却在废墟间有序穿行，队长手中的三防平板正闪烁着北斗卫星信号，定位坐标与伤亡信息化作一行行短报文，穿透通信孤岛直达指挥中心。这是AOROP1100三防平板搭载的北斗短报文功能在应急救援中的真实场景，更代表了工业移动终端在极端环境下的能力跃迁。AOROP1100三防平板作为遨游通讯2025年推出的旗舰三防设备，AOROP1100三防平板的技术基底
猎板 PCB 控深槽工艺：5G 基站散热模块的关键支撑猎板PCB黄浩 5G 运维数据库
PCB控深槽工艺在5G基站散热模块中的关键作用：猎板PCB的技术突破在5G基站的密集高频信号与高功率运行环境下，散热性能直接决定了设备的稳定性和寿命。猎板PCB通过创新性的控深槽工艺（控深锣/控深铣），结合材料科学与结构优化，为5G基站散热模块提供了高精度、高可靠性的解决方案，有效攻克了高热负荷下的技术瓶颈。一、5G基站散热的核心挑战热负荷激增：5G基站的射频功放（PA）、电源管理模块等器件功耗显
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
旧系统UI焕新陷阱：保留业务习惯与引入新交互的平衡点把控贝格前端工场 ui 交互
摘要**想给老旧系统换上“高颜值新衣”，却遭遇员工集体吐槽“不会用”？满心期待新交互能提升效率，结果用户操作频频出错，业务进度反而被拖慢？旧系统UI焕新本是优化体验的好机会，可在保留多年养成的业务操作习惯，与引入更先进便捷的新交互方式之间，却横亘着巨大鸿沟。稍有不慎，就会陷入“改了不如不改”的尴尬境地。这场关于“守旧”与“创新”的博弈，究竟该如何破局？一、旧系统UI焕新：一场甜蜜又棘手的改造工程旧
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
直返APP的创始人是谁他们的创业背景和经历如何? 氧惠帮朋友一起省
直返的创始人是李明，他是一位富有创新精神的电商专家。他看到了传统电商模式的局限，并决心打破这些局限，为消费者带来更实惠、更便捷的购物体验。于是，他创立了直返这一独特的电商模式，通过省去中间环节、直接返还利润给消费者，实现了购物的简单与实惠。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
四月的最后一天喵喵诗茵
今天，是四月的最后一天，在上班，但没啥事需要做，今天一天都没有询盘，好像那些买家知道我们快要放假了，也不愿来打扰我们了，哈哈哈。下午，老大叫我们去会议室聊聊提成的事情，每月目标一千美金，超过一千美金按营业额的3%拿提成，看似不多，但以店铺目前的情况来看，我和另一个同事都觉得非常难。每天不到十个询盘，有时候连五个都没有，五个询盘能成一个订单已经是相当不错的结果了，但一个订单带来的营业额扣除了国际运费
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
缘起缘灭一续龙抬头0158
新娘吴雨对钱程也熟悉，在这帮小兄弟眼里，钱程为又豪爽，绝对是大家宠儿，自然吴雨也不例外。阿兵哈哈大笑，侧过头，对钱程说道：“是的，打不过你，你去喝茶，下半夜我让你。”“我是回家了，你们通宵吧。”钱程说道，站起来要走。“不能走，建军，不要让他回去，今天难得。”坐床沿上打牌的卫东对建军说。阿兵、卫东、建军是这帮人中和钱程玩得最好的，自然不让钱程回，死活要拉着钱程。“不回家，我睡哪？去新床睡，哈哈哈。”
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
智慧.专注甜蜜区 YXH花非花
"史上最佳击球手"告诉巴菲特——只打那些“甜蜜区”的股神巴菲特的办公室里，贴着一张美国棒球手的海报：他就是对巴菲特投资理念影响极大的一个人——波士顿红袜队的击球手：泰德，被称为“史上最佳击球手”。其实，在棒球运动员中，有两类击球手。一类是什么球都打，每次击球都全力以赴，力求全垒打。另一类人则是聪明的击打者，他们只打高概率的球。世界排名前十的击球手，都是后面这类人，而泰德·威廉斯就是这类人中的高手。
2022.4.15 河南麦子的书写
#暮省1.#健身三人行2022.4.15体重：早，52.6；晚，。健身：53.4早，跑步5㎞；晚，散步＋瑜伽。2.#君子兰班监考，改卷，发现问题。3.#读书读30多页，梳理了三讲内容。4.#碎屑中午自己包的饺子，融入创新元素，却看不出来：用菜汁和面，面并不呈现绿色，可能是因为我用的是紫叶生菜。把拧了菜汁之后的生菜芫荽放进馅儿里，比昨天好吃多了。上午同事梅妹妹给我带了这么多槐花，香气四溢，下午读书就
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

【项目实训】【项目博客#06】大模型微调与推理优化（4.21-5.11）