、水水水水水

huggingface(三)

HF笔记（三）

本篇文章通过一个简单的例子，来解释如何通过训练的模型，使用本地的数据集，对模型经行下游任务的实现。本片文章思路参考B站视频【翻遍整个B站，这绝对是2025讲的最好的HuggingFace教程，带你3小时吃透huggingface与Transformers，少走99%的弯路！】https://www.bilibili.com/video/BV1KTQcYUEeT?p=4&vd_source=1a0d4758ac4c6a667a8686daaa0d1b5e，最近B站好像涌现了不少这样的视频，感觉比较有学习意义，值得一看。

一、下载数据集与模型

下载数据集时，我们仿照huggingface(二)中的方法，下载lansinuote/ChnSentiCorp · Datasets at Hugging Face](https://huggingface.co/datasets/lansinuote/ChnSentiCorp)这一数据集：

from huggingface_hub import snapshot_download

# 下载数据集
snapshot_download(
    repo_id="lansinuote/ChnSentiCorp",  # 数据集的repo_id
    repo_type="dataset",                  # 指定类型为 dataset
    local_dir=r"F:\Python Project\Project\Natural Language Processing\huggingface\data\ChnSentiCorp",  # 本地保存路径(可以替换为自己的绝对路径)
    resume_download=True,                 # 支持断点续传
    token="hf_nkaCdM******AbEkbjLKvuZdEOTtV"  # 替换为你的 Hugging Face 令牌
)

我们可以在这个文件的data文件夹下看到三个文件，分别是这组数据的训练集、测试集和校准集：

我们可以通过python代码来加载数据集字典（DatasetDict）：

from datasets import load_dataset,load_from_disk

dataset = load_dataset(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\ChnSentiCorp\data",
                      #split = 'train' #如果只想输出训练集信息，可以使用split参数)
print(dataset)

# dataset = load_from_disk(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\ChnSentiCorp")
# print(dataset)

结果：

DatasetDict({
    train: Dataset({
        features: ['text', 'label'],
        num_rows: 9600
    })
    validation: Dataset({
        features: ['text', 'label'],
        num_rows: 1200
    })
    test: Dataset({
        features: ['text', 'label'],
        num_rows: 1200
    })
})

与我们从文件中观察到的数据是相同的，但这个只是这组数据的概述，我们想要进一步读取数据内容还需要一些步骤。

**注意：**我们这里不能直接使用dataset = load_from_disk(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\ChnSentiCorp")来读取我们的数据，原因是load_from_disk()适合读取.arrow后缀的文件，所以我们可以在data目录下新建一个文件夹，将arrow类型的数据存放在里面：

dataset.save_to_disk(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\CHN-arrow")

结果：

Saving the dataset (1/1 shards): 100%|██████████| 9600/9600 [00:00<00:00, 1597196.29 examples/s]
Saving the dataset (1/1 shards): 100%|██████████| 1200/1200 [00:00<00:00, 406457.63 examples/s]
Saving the dataset (1/1 shards): 100%|██████████| 1200/1200 [00:00<00:00, 598473.82 examples/s]

你会发现这三组数据分别被存放到了不同的文件夹中，分别对应训练集、测试集和校准集。

此时，我们可以使用load_from_disk读取数据。

from datasets import load_dataset,load_from_disk

# dataset = load_dataset(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\ChnSentiCorp\data",
#                        #split='train'
#                        )
# dataset.save_to_disk(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\CHN-arrow")

train_dataset = load_from_disk(r"F:\Python Project\Project\Natural Language Processing\huggingface\data\CHN-arrow\train")
print(train_dataset)

提取到训练数据的结果：

Dataset({
    features: ['text', 'label'],
    num_rows: 9600
})

随后，我们下载为我们本例中需要使用的模型——google-bert/bert-base-chinese，代码如下：

from huggingface_hub import snapshot_download

snapshot_download(
    repo_id="google-bert/bert-base-chinese",  # 数据集的repo_id
    #repo_type="dataset",                  # 指定类型为 dataset（下载模型时，将类型注释掉）
    local_dir=r"F:\cache_model\bert-base-chinese",  # 本地保存路径(可以替换为自己的绝对路径)
    resume_download=True,                 # 支持断点续传（可以不写，这个参数已经被新版的弃用了）
    token="hf_nkaCdM******AbEkbjLKvuZdEOTtV"  # 替换为你的 Hugging Face 令牌
)

二、下游任务设定——基于Bert的中文情感分析

2.1 定义下载数据集方法

为了得到我们的数据，我们需要编写一个名为load_data.py的文件来获取数据集中的内容。代码如下：

from datasets import load_from_disk
from torch.utils.data import Dataset

class Load_Dataset(Dataset):
    def __init__(self,split):
        self.dataset = load_from_disk(r'F:\Python Project\Project\Natural Language Processing\huggingface\data\CHN-arrow')
        if split == "train":
            self.dataset = self.dataset['train']
        elif split == "validation":
            self.dataset = self.dataset['validation']
        elif split == "test":
            self.dataset = self.dataset["test"]
        else:
            print("The name of dataset is incorrect")
    
    def __len__(self):
        return len(self.dataset)
    
    def __getitem__(self, item):
        text = self.dataset[item]["text"]
        label = self.dataset[item]["label"]
        return text,label
    
if __name__ == "__main__":
    dataset = Load_Dataset("train")
    for data in dataset:#输出训练数据
        print(data)

注意：我们在第一节中获得了arrow类型的数据，但这不算完。如果你直接执行这段代码，你会出现以下问题：

FileNotFoundError: Directory F:\Python Project\Project\Natural Language Processing\huggingface\data\CHN-arrow is neither a `Dataset` directory nor a `DatasetDict` directory.

经过学习，我找到了一篇文章https://blog.csdn.net/shizheng_Li/article/details/144811077https://blog.csdn.net/shizheng_Li/article/details/144811077。该文章说明，这是因为，Hugging Face 的 datasets 库会通过检查目录中的特定文件来确定一个目录是否是一个有效的 Dataset 或 DatasetDict 目录。主要通过以下几个文件来进行判断：

dataset_dict.json：这个文件是用于 DatasetDict 类型的数据集。DatasetDict 是一个包含多个数据集分割（如 train、validation 等）的字典。如果这个文件存在，Hugging Face 会认为该目录是一个 DatasetDict。
dataset_info.json：这个文件存储了数据集的元数据，包括数据集的特征、版本信息等。如果这个文件存在，Hugging Face 会根据它来加载数据集的结构。
state.json 指定arrow文件和split切分等。

所以我们需要把原来文件夹中的dataset_dict.json、dataset_info.json文件复制到CHN-arrow的根目录下，如下所示：

随后你就得到了以下的输出（部分）：

('机器配置不均衡，CPU很高，硬盘小了点，没有摄像头，没有蓝牙，这两个应该是属于商务该有的配置，什么附件都没有送，竟然连安装和驱动一类的光盘都没有，我倒，太小气了！硬盘小就小点吧，但也应配个7200转的', 0)
('我定了2本书,为什么只发了一本,我使用了礼券,?31岁小美女的养颜经?这本书就没发货.订单号： 1450990450 能帮我查查吗?', 0)
('不装xp也就算了。给的驱动盘还是vista专用的。。。难道不带xp玩儿了？', 0)

2.2 模型定义

首先， 我们需要导入我们即将使用到的模型——bert-base-chinese。由于它是bert框架的模型，我们一般使用transformer库中的BertModel类来导入这个模型。 BertModel可以自适应地导入bert类型的大模型。我们创建一个名为net.py的文件，存储我们这个任务的网络结构。代码如下：

from transformers import BertModel
import torch

DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_dir = r"F:\\cache_model\\bert-base-chinese"

pretrained_model = BertModel.from_pretrained(model_dir).to(DEVICE)
print(pretrained_model)

结果：

#输出的结果是bert模型的结构
BertModel(
  (embeddings): BertEmbeddings(
    # 词嵌入层：将词ID映射为768维向量（中文BERT的词表大小为21128）
    (word_embeddings): Embedding(21128, 768, padding_idx=0)  # padding_idx=0 表示索引0的token（[PAD]）不参与梯度更新
    # 位置嵌入层：最大支持512个位置（对应BERT最大输入长度）
    (position_embeddings): Embedding(512, 768)  
    # 句子类型嵌入层：用于区分两个句子（如问答任务中的问题和上下文）
    (token_type_embeddings): Embedding(2, 768)  
    # 层归一化：对嵌入结果进行标准化（768维向量，epsilon=1e-12防止除零）
    (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)  
    # Dropout层：随机丢弃10%的神经元防止过拟合
    (dropout): Dropout(p=0.1, inplace=False)  
  )
  (encoder): BertEncoder(
    (layer): ModuleList(
      # BERT-base 包含12层Transformer编码层（0-11共12个）
      (0-11): 12 x BertLayer(  
        (attention): BertAttention(
          (self): BertSdpaSelfAttention(
            # 自注意力机制中的Q/K/V矩阵（均从768维映射到768维）
            (query): Linear(in_features=768, out_features=768, bias=True)  
            (key): Linear(in_features=768, out_features=768, bias=True)  
            (value): Linear(in_features=768, out_features=768, bias=True)  
            # 注意力权重Dropout（丢弃10%）
            (dropout): Dropout(p=0.1, inplace=False)  
          )
          (output): BertSelfOutput(
            # 将注意力输出映射回768维
            (dense): Linear(in_features=768, out_features=768, bias=True)  
            # 层归一化 + Dropout（与嵌入层参数一致）
            (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)  
            (dropout): Dropout(p=0.1, inplace=False)  
          )
        )
        (intermediate): BertIntermediate(
          # 中间层：将768维扩展为3072维（用于增强模型容量）
          (dense): Linear(in_features=768, out_features=3072, bias=True)  
          # 激活函数：GELU（比ReLU更平滑）
          (intermediate_act_fn): GELUActivation()  
        )
        (output): BertOutput(
          # 将中间层输出压缩回768维（保持维度一致）
          (dense): Linear(in_features=3072, out_features=768, bias=True)  
          # 层归一化 + Dropout
          (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)  
          (dropout): Dropout(p=0.1, inplace=False)  
        )
      )
    )
  )
  (pooler): BertPooler(
    # 池化层：提取句子整体表示（取第一个token [CLS] 的向量）
    (dense): Linear(in_features=768, out_features=768, bias=True)  
    # 激活函数：Tanh（将输出限制在[-1, 1]区间）
    (activation): Tanh()  
  )
)

**接着，**我们定义一个非常简单的全连接层，对bert输出后的结果进行训练，类似于bert之后接一个MLP，进行二分类任务（完整代码如下）：

from transformers import BertModel
import torch

DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_dir = r"F:\\cache_model\\bert-base-chinese"

pretrained_model = BertModel.from_pretrained(model_dir).to(DEVICE)

class Model(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.fc = torch.nn.Linear(768,2)
    
    def forward(self,input_ids,attention_mask,token_type_ids):
        with torch.no_grad():
            out = pretrained_model(input_ids=input_ids,attention_mask=attention_mask,token_type_ids=token_type_ids)
        out = self.fc(out.last_hidden_state[:,0])
        out = out.softmax(dim=1)
        return out

注意： with torch.no_grad():意味着模型不参与后续网络的训练，也就是说我们不需要使用梯度下降来反向更新模型中的参数。

2.3 定义训练函数

我们创建一个名为train.py文件来实现模型下游任务的训练过程。具体代码如下：

import torch
from load_data import Load_Dataset  # 自定义数据集加载器（load_data.py文件）
from torch.utils.data import DataLoader
from net import Model  # 自定义模型结构(net.py文件)
from transformers import BertTokenizer, AdamW  # BERT相关组件

# 设置训练设备（GPU/CPU）
DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")
epoch = 5  # 训练轮数
model_dir = r"F:\\cache_model\\bert-base-chinese"  # 预训练模型路径

# 加载BERT分词器
token = BertTokenizer.from_pretrained(model_dir)

# 定义数据批处理函数
def collate_fn(data):
    # 分离句子和标签
    sentes = [i[0] for i in data]  # 提取文本数据
    label = [i[1] for i in data]   # 提取标签数据
    
    # BERT编码处理
    data = token.batch_encode_plus(
        batch_text_or_text_pairs=sentes,
        truncation=True,          # 截断过长文本
        padding="max_length",     # 填充到最大长度
        max_length = 350,         # 最大序列长度
        return_tensors="pt",      # 返回PyTorch张量
        return_length=True        # 返回实际长度
    )
    
    # 解包编码结果
    input_ids = data['input_ids']          # 文本ID表示
    attention_mask=data['attention_mask']  # 注意力掩码
    token_type_ids = data['token_type_ids']# 段落标记
    labels = torch.LongTensor(label)       # 转换为LongTensor
    
    return input_ids, attention_mask, token_type_ids, labels

# 创建训练数据集和数据加载器
train_dataset = Load_Dataset("train")
train_loader = DataLoader(
    dataset=train_dataset,
    batch_size=32,        # 每批数据量
    shuffle=True,          # 打乱数据顺序
    drop_last=True,        # 丢弃最后不足批次的数据
    collate_fn=collate_fn  # 使用自定义批处理函数
)

if __name__ == "__main__":
    print(DEVICE)  # 打印使用的设备
    model = Model().to(DEVICE)  # 注意：Model类需要正确定义
    
    # 设置优化器和损失函数
    optimizer = AdamW(model.parameters(), lr=5e-4)  # 使用AdamW优化器
    loss_func  = torch.nn.CrossEntropyLoss()        # 交叉熵损失函数

    # 训练循环
    model.train()
    for epoch in range(epoch):
        # 遍历训练数据
        for i, (input_ids, attention_mask, token_type_ids, labels) in enumerate(train_loader):
            input_ids = input_ids.to(DEVICE)
            attention_mask = attention_mask.to(DEVICE)
            token_type_ids = token_type_ids.to(DEVICE)
            labels = labels.to(DEVICE)
            out = model(input_ids, attention_mask, token_type_ids)# 前向传播
            loss = loss_func(out, labels)# 计算损失

            # 反向传播和优化
            optimizer.zero_grad()  # 清空梯度
            loss.backward()        # 反向传播
            optimizer.step()       # 更新参数
            if i % 5 == 0:
                out = out.argmax(dim=1)  # 获取预测结果
                acc = (out == labels).sum().item() / len(labels)  # 计算准确率
                print(epoch, i, loss.item(), acc)  # 输出当前状态
        torch.save(model.state_dict(), f"params/{epoch}bert.pt") # 保存模型参数
        print("参数保存成功")

结果：

3 0 0.4176948368549347 0.90625
3 5 0.38985922932624817 0.9375
3 10 0.49415409564971924 0.8125
.
.
.
3 295 0.4426736533641815 0.84375
参数保存成功

注意：你会发现，在训练过程中，acc好像在循环出现。这是因为模型过拟合了[捂脸]。不过没有关系，走到这一步你已经完成了该任务的80%。

2.4 测试模型效果

以下是使用第三个epoch来计算模型的acc值的代码：

import torch
from load_data import Load_Dataset
from torch.utils.data import DataLoader
from net import Model
from transformers import BertTokenizer

DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_dir = r"F:\\cache_model\\bert-base-chinese"
token = BertTokenizer.from_pretrained(model_dir)

def collate_fn(data):
    sentes = [i[0] for i in data]
    label = [i[1] for i in data]

    data = token.batch_encode_plus(
        batch_text_or_text_pairs=sentes,
        truncation=True,
        padding="max_length",
        max_length = 350,
        return_tensors="pt",
        return_length=True
    )

    input_ids = data['input_ids']
    attention_mask=data['attention_mask']
    token_type_ids = data['token_type_ids']
    labels = torch.LongTensor(label)

    return input_ids,attention_mask,token_type_ids,labels

test_dataset = Load_Dataset("test")
test_loader = DataLoader(
    dataset=test_dataset,
    batch_size=32,
    shuffle=True,
    drop_last=True,
    collate_fn=collate_fn
)

if __name__ == "__main__":
    acc = 0
    total = 0
    model = Model().to(DEVICE)
    model.load_state_dict(torch.load("params/3bert.pt"))
    model.eval()
    for i,(input_ids,attention_mask,token_type_ids,labels) in enumerate(test_loader):
            input_ids,attention_mask,token_type_ids,labels = input_ids.to(DEVICE),\
            attention_mask.to(DEVICE),token_type_ids.to(DEVICE),labels.to(DEVICE)

            out = model(input_ids,attention_mask,token_type_ids)
            out = out.argmax(dim=1)
            acc += (out == labels).sum().item()
            total += len(labels)
    print(acc/total)

注意：test_dataset = Load_Dataset("test")一定不要忘记修改为test。结果如下：

0.893581081081081

2.5 交互测试

我们可以在控制台输入自己想说的话来让模型判断到底是正面的情绪还是负面的情绪，代码如下：

import torch
from net import Model
from transformers import BertTokenizer

DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")
names = ["负向评价","正向评价"]
model_dir = r"F:\\cache_model\\bert-base-chinese"

model = Model().to(DEVICE)
token = BertTokenizer.from_pretrained(model_dir)

def collate_fn(data):
    sentes = []
    sentes.append(data)

    data = token.batch_encode_plus(
        batch_text_or_text_pairs=sentes,
        truncation=True,
        padding="max_length",
        max_length = 350,
        return_tensors="pt",
        return_length=True
    )
    input_ids = data['input_ids']
    attention_mask=data['attention_mask']
    token_type_ids = data['token_type_ids']

    return input_ids,attention_mask,token_type_ids

def test():
    model.load_state_dict(torch.load("params/4bert.pt"))
    model.eval()
    while True:
        data = input("请你输入测试数据（“q”是退出）")
        if data == "q":
            print("evaluate ended")
            break
        input_ids,attention_mask,token_type_ids = collate_fn(data)
        input_ids,attention_mask,token_type_ids = input_ids.to(DEVICE),\
            attention_mask.to(DEVICE),token_type_ids.to(DEVICE)
        with torch.no_grad():
            out = model(input_ids,attention_mask,token_type_ids)
            out = out.argmax(dim=1)
            print("模型判定为",names[out],"\n")

if __name__ == "__main__":
    test()

结果：

请你输入测试数据（“q”是退出）今天的天气真好啊      
模型判定为 正向评价 

请你输入测试数据（“q”是退出）今天我心情不大好
模型判定为 负向评价

OK，本次模型下游任务实验就到此结束了，有兴趣的可以尝试更多分类的任务，或者使用不同的数据集、语言模型进行试验。

参考资料：

[1]https://blog.csdn.net/shizheng_Li/article/details/144811077https://blog.csdn.net/shizheng_Li/article/details/144811077

[2]【翻遍整个B站，这绝对是2025讲的最好的HuggingFace教程，带你3小时吃透huggingface与Transformers，少走99%的弯路！】https://www.bilibili.com/video/BV1KTQcYUEeT?p=8&vd_source=1a0d4758ac4c6a667a8686daaa0d1b5e

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu