云边有个稻草人

“ 重磅揭秘：如何打造超高效的机器学习系统，释放大模型潜力？”

引言

一、大模型的定义与特点

1.1 大模型的定义

1.2 大模型的特点

二、机器学习系统的架构设计

2.1 系统架构概述

2.2 数据处理与管道设计

数据预处理与特征工程

数据存储与分发

2.3 分布式计算与并行化

2.4 高效存储和模型管理

三、大模型的训练与优化

3.1 训练大模型所需的资源

3.2 模型并行化技术

3.3 参数共享与模型压缩

四、模型部署与推理

4.1 推理引擎的选择

推理引擎的选择标准

常见推理引擎

4.2 模型量化与剪枝

模型量化

剪枝

示例：量化模型

4.3 推理加速与硬件优化

4.4 部署模型到生产环境

正文开始——

前些天发现了一个不错的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击即可进入学习

人工智能教程

引言

机器学习（ML）和深度学习（DL）近年来取得了飞速进展。尤其是大规模深度神经网络模型的出现，推动了各行各业的技术革新。例如，像GPT-3、BERT、ResNet等模型通过大规模的预训练和模型参数调优，极大提高了自然语言处理、计算机视觉等任务的准确性。然而，大模型也带来了前所未有的挑战，尤其是在计算资源、存储需求、训练时间等方面。为了有效地训练这些大模型并将其应用于现实世界中，合理的工程架构设计是至关重要的。

本文将深入探讨机器学习系统的工程架构，重点讨论如何设计和优化适应大模型的训练和部署环境。我们将详细分析大模型的特点，设计高效的数据管道，利用分布式计算加速训练，并探讨在实际应用中如何优化推理速度。通过深入的技术细节和代码示例，我们将帮助读者理解如何构建一个支持大模型的完整机器学习系统。

一、大模型的定义与特点

1.1 大模型的定义

大模型通常指的是具有极大参数量和计算需求的深度学习模型。这些模型的规模和复杂度往往使得训练过程对计算资源、存储和时间的需求远超传统模型。例如，GPT-3包含了1750亿个参数，BERT的参数也达到数亿个。这类模型通常涉及复杂的任务，如语言生成、图像识别、语义理解等，并且能够通过大规模数据的训练捕获任务中的高维度特征。

随着模型规模的增大，涉及的参数、计算量、存储需求和时间复杂度都急剧增加。大模型不仅要求强大的计算能力（如GPU、TPU），还需要更多的内存和磁盘空间来存储中间结果和模型权重。此外，数据量也随之增加，通常需要海量的标注数据进行训练。

1.2 大模型的特点

大模型的训练和推理通常有以下几个显著特点：

计算和存储开销大：训练大模型需要大量的计算资源，通常需要多台计算机（甚至集群）来分担计算任务。每次训练迭代需要的时间长，且训练周期可能长达数月，甚至年。
长时间训练：由于需要大量的计算和存储资源，训练时间通常较长。特别是当涉及到庞大数据集和复杂模型时，训练时间更是成倍增加。
数据和硬件依赖性强：大模型通常要求有海量的训练数据。为了有效利用这些数据并加速训练过程，往往需要依赖分布式计算系统以及高性能计算硬件（如NVIDIA GPU、Google TPU等）。
优化与正则化的挑战：大模型往往容易出现过拟合和梯度爆炸等问题，优化和正则化策略（如Dropout、L2正则化等）变得尤为重要。

二、机器学习系统的架构设计

随着大模型的不断发展，如何构建一个能够有效支持大规模深度学习模型的机器学习系统架构变得至关重要。在设计系统时，我们需要考虑数据处理、训练优化、存储管理以及推理效率等多个方面。

2.1 系统架构概述

一个理想的机器学习系统架构应包含以下几个层次，分别应对不同的计算任务和数据需求：

数据层：数据是机器学习系统的核心，系统需要具备高效的数据预处理、清洗、存储、加载和分发能力。大规模数据集通常需要通过分布式存储系统来进行管理，如使用HDFS、Ceph等分布式文件系统。数据的预处理和增强（如归一化、数据增强等）也需要高效实现。
训练层：这是大模型的核心部分，负责执行模型训练和优化任务。为提高计算效率，训练层需要支持分布式计算，并使用多GPU、TPU等加速硬件。训练层还需要支持高效的优化算法（如Adam、LAMB等），以确保大模型在面对海量数据时能够快速收敛。
推理层：训练完成后，模型进入推理阶段。此阶段要求低延迟和高吞吐量，通常用于实时决策、图像识别、语音生成等任务。为了提高推理效率，推理层需要集成高效的推理引擎（如TensorRT、ONNX Runtime等），并且支持硬件加速（如GPU、TPU等）。
存储与管理层：大模型和大数据的存储管理同样重要。需要高效的存储系统来保存训练过程中的权重、梯度以及中间结果。此外，模型的管理也很关键，需要记录和管理不同版本的模型及其训练配置，以便快速恢复和部署。

2.2 数据处理与管道设计

数据管道设计是机器学习系统中非常重要的一环。在大模型训练中，数据的处理和传输效率直接影响到模型训练的效率。

数据预处理与特征工程

数据预处理通常包括数据清洗、去噪声、特征选择与提取等。大模型的训练需要大量高质量的数据，因此，预处理阶段必须保证数据的有效性和多样性。例如，文本数据通常需要进行分词、去停用词、词嵌入等操作；图像数据则需要进行裁剪、旋转、缩放等数据增强。

from sklearn.preprocessing import StandardScaler

# 假设我们有一组训练数据
data = [[1.2, 2.3, 3.3], [2.4, 3.6, 2.5], [3.5, 4.5, 1.3]]

# 使用StandardScaler进行数据标准化
scaler = StandardScaler()
scaled_data = scaler.fit_transform(data)

print(scaled_data)

数据存储与分发

训练大模型时，数据的存储和分发也是不可忽视的环节。大规模数据集的存储需求通常高于常规数据，因此常采用分布式存储系统（如HDFS、Ceph）来管理数据。这些系统可以支持数据的高并发读取和分发，从而加速训练过程。

2.3 分布式计算与并行化

由于大模型的计算需求极高，通常需要采用分布式计算来加速训练过程。分布式计算不仅能够在多台计算机上进行训练，还能通过模型并行和数据并行技术，进一步提升计算效率。

数据并行：数据并行将训练数据分割成多个子集，在不同计算节点上并行训练。每个计算节点保存一份完整的模型副本，计算完自己的梯度后，再通过通信同步模型权重。
模型并行：当模型过大，单个计算节点无法承载整个模型时，模型并行技术会将模型拆分成多个部分，每个计算节点处理模型的不同部分。通过节点间的通信同步不同部分的计算结果，从而实现整体模型的训练。

示例：使用PyTorch进行数据并行

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader

# 定义简单的神经网络
class SimpleNN(nn.Module):
    def __init__(self, input_dim, output_dim):
        super(SimpleNN, self).__init__()
        self.fc = nn.Linear(input_dim, output_dim)

    def forward(self, x):
        return self.fc(x)

# 创建模型实例
model = SimpleNN(512, 10)

# 使用DataParallel进行数据并行
model = nn.DataParallel(model)

# 示例：创建一个简单的数据加载器
dataset = SimpleDataset(10000, 512)
data_loader = DataLoader(dataset, batch_size=32, shuffle=True)

# 训练模型
optimizer = optim.SGD(model.parameters(), lr=0.01)
criterion = nn.CrossEntropyLoss()

for data in data_loader:
    optimizer.zero_grad()
    output = model(data.float())
    loss = criterion(output, data.long())
    loss.backward()
    optimizer.step()

通过DataParallel，我们可以在多个GPU上并行训练模型，大大加速了训练过程。

2.4 高效存储和模型管理

在训练过程中，保存中间结果、梯度和模型权重非常重要。常见的存储系统包括分布式存储系统（如HDFS、Ceph），这些系统能够提供高吞吐量和低延迟的数据存取。而对于模型的版本管理，通常需要使用工具（如MLflow、DVC）来进行管理，以确保每个模型版本的可追溯性。

三、大模型的训练与优化

3.1 训练大模型所需的资源

训练大模型往往需要大量的硬件资源。例如，使用多个GPU进行并行训练，可以通过加速计算过程，减少训练时间。此外，为了存储大模型及其训练数据，通常还需要大容量的存储系统。

3.2 模型并行化技术

当模型的大小超出单个计算节点的内存时，模型并行就变得尤为重要。模型并行将模型分割成多个部分，分别在不同的计算节点上进行训练。

import torch.nn as nn
import torch
import torch.optim as optim

class LargeModel(nn.Module):
    def __init__(self):
        super(LargeModel, self).__init__()
        # 定义两个部分
        self.part1 = nn.Linear(512, 1024)
        self.part2 = nn.Linear(1024, 10)

    def forward(self, x):
        part1_out = self.part1(x)
        part2_out = self.part2(part1_out)
        return part2_out

# 模型切分到不同设备
device1 = torch.device("cuda:0")
device2 = torch.device("cuda:1")
model = LargeModel().to(device1)

# 分别将两部分传输到不同的GPU
part1_output = model.part1(input_data.to(device1))
part2_output = model.part2(part1_output.to(device2))

通过模型并行化技术，我们可以将大模型分布到多个GPU上，确保每个计算节点只处理模型的部分任务。

3.3 参数共享与模型压缩

为了减小模型的大小并提高计算效率，参数共享和模型压缩技术（如LoRA、知识蒸馏）变得越来越重要。通过这些方法，可以在不显著降低模型精度的情况下，显著减少训练和推理的计算量。

四、模型部署与推理

4.1 推理引擎的选择

模型训练完成后，接下来的关键步骤是将训练好的模型部署到生产环境中进行推理。推理的目标是快速、准确地为新输入数据生成预测结果。与训练阶段相比，推理对延迟和计算资源的要求更加苛刻。因为推理通常用于实际的实时应用中，例如语音识别、图像分类和推荐系统等。因此，高效的推理引擎对于保证系统响应速度和吞吐量至关重要。

推理引擎的选择标准

在选择推理引擎时，我们通常关注以下几个标准：

硬件支持：推理引擎是否能够充分利用GPU、TPU或其他加速硬件，以提高计算效率。
跨平台兼容性：推理引擎是否支持多种硬件平台和操作系统。
优化功能：推理引擎是否支持模型量化、剪枝、融合等优化技术，减少计算负担。
低延迟：推理过程中的响应时间，特别是在需要实时决策的应用场景中，低延迟至关重要。
高吞吐量：对于批量推理场景，高吞吐量能够确保高效处理大量请求。

常见推理引擎

TensorRT：这是NVIDIA开发的一款高效推理引擎，专为GPU优化，支持深度学习模型的加速推理。TensorRT支持FP16和INT8量化，通过降低数值精度来提高推理速度。
- 适用场景：实时推理，如自动驾驶、语音识别等。
ONNX Runtime：这是微软开发的开源推理引擎，支持多种硬件平台（包括CPU、GPU、TPU等）。ONNX Runtime具有良好的跨平台兼容性，能够支持多种深度学习框架的模型（如TensorFlow、PyTorch等）进行推理。
- 适用场景：跨平台应用，需要支持不同深度学习框架的推理。
TensorFlow Lite：这是TensorFlow为移动端和嵌入式设备设计的推理引擎。它支持高效地在低功耗设备上运行深度学习模型，适用于移动设备和物联网设备的推理应用。
- 适用场景：移动端应用，如智能手机上的图像识别和语音识别。
TorchServe：这是由AWS和Facebook联合开发的一个PyTorch模型服务化框架，专门用于将PyTorch模型部署为Web服务。它支持高效的批量推理、动态模型加载、版本控制等功能。
- 适用场景：基于PyTorch的生产环境模型部署。

示例：使用ONNX Runtime进行推理

ONNX Runtime是一个非常流行的推理引擎，支持跨平台部署。以下是如何将PyTorch训练好的模型转换为ONNX格式，并使用ONNX Runtime进行推理的示例：

import torch
import torch.onnx
import onnxruntime as ort

# 假设有一个训练好的PyTorch模型
class SimpleModel(torch.nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc = torch.nn.Linear(512, 10)

    def forward(self, x):
        return self.fc(x)

# 创建模型并加载训练好的权重
model = SimpleModel()
model.load_state_dict(torch.load("model.pth"))
model.eval()

# 转换为ONNX格式
dummy_input = torch.randn(1, 512)
torch.onnx.export(model, dummy_input, "model.onnx")

# 使用ONNX Runtime进行推理
ort_session = ort.InferenceSession("model.onnx")
inputs = {ort_session.get_inputs()[0].name: dummy_input.numpy()}
outputs = ort_session.run(None, inputs)

print(outputs)

上述代码演示了如何将PyTorch训练好的模型转换为ONNX格式，并使用ONNX Runtime进行推理。通过这种方式，用户能够轻松地将模型部署到多个平台中。

4.2 模型量化与剪枝

为了在推理过程中提高速度并降低计算成本，常常需要对模型进行优化。常见的优化技术包括模型量化和剪枝。

模型量化

量化是指通过减少模型参数的精度（例如，从32位浮动点减少到16位或8位整数）来减少计算和存储需求。量化可以显著提升推理速度，特别是在硬件加速器（如GPU、TPU）上。

量化的优势：
- 减少内存占用和计算量，提高推理速度。
- 在大多数情况下，量化不会显著影响模型的准确性。
常见量化方法：
- 权重量化：将模型的权重从高精度浮动点数值（如32位）减少到较低精度（如8位整数）。
- 激活量化：将模型中每一层的激活值量化，从而减少内存访问和计算量。

剪枝

剪枝是通过去除模型中不重要的参数（如那些接近零的权重）来减小模型的规模和计算复杂度。剪枝可以显著减少模型的计算量，尤其是在推理阶段。

剪枝的优势：
- 剪枝后的模型更小，推理更快。
- 可以用于精简深度网络中的冗余部分。
常见剪枝技术：
- 权重剪枝：去除那些具有较小权重值的连接。
- 神经元剪枝：去除输出较少的神经元，减少计算量。

示例：量化模型

使用TensorFlow Lite进行模型量化：

import tensorflow as tf

# 假设已经有一个训练好的模型
model = tf.keras.models.load_model('model.h5')

# 将模型转换为TensorFlow Lite格式并进行量化
converter = tf.lite.TFLiteConverter.from_keras_model(model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]  # 开启量化优化
tflite_model = converter.convert()

# 保存量化后的TFLite模型
with open("model_quantized.tflite", "wb") as f:
    f.write(tflite_model)

该代码将一个训练好的TensorFlow Keras模型转换为量化后的TensorFlow Lite模型。这对于需要在移动设备或嵌入式设备上部署的应用特别有用。

4.3 推理加速与硬件优化

除了量化和剪枝，推理加速还涉及到硬件平台的优化。根据实际需求，选择合适的硬件平台至关重要。常见的硬件加速选项包括：

GPU加速：GPU能够并行处理大量计算任务，特别适合用于深度学习推理。在TensorFlow和PyTorch等深度学习框架中，GPU加速已成为标准配置。
TPU加速：Google的TPU（Tensor Processing Unit）专门设计用于加速深度学习计算，尤其是用于大规模的模型推理。TPU可以提供更高的吞吐量和更低的延迟，适用于大规模推理任务。
FPGA和ASIC：在某些特定应用场景下，FPGA和ASIC（应用特定集成电路）提供了专用硬件加速，可以在低功耗下运行推理任务。

示例：使用TensorRT优化GPU推理

TensorRT是NVIDIA推出的推理加速库，能够通过优化模型，使其在NVIDIA GPU上执行得更快。以下是如何使用TensorRT加速推理的示例：

import tensorrt as trt
import pycuda.driver as cuda
import pycuda.autoinit

# 加载ONNX模型
onnx_model_path = 'model.onnx'
TRT_LOGGER = trt.Logger(trt.Logger.WARNING)
builder = trt.Builder(TRT_LOGGER)
network = builder.create_network()

# 解析ONNX模型
onnx_parser = trt.OnnxParser(network, TRT_LOGGER)
with open(onnx_model_path, 'rb') as f:
    onnx_model = f.read()
onnx_parser.parse(onnx_model)

# 配置TensorRT优化器
builder.max_batch_size = 1
builder.max_workspace_size = 1 << 30  # 1GB

# 构建优化的TensorRT引擎
engine = builder.build_cuda_engine(network)

# 执行推理
context = engine.create_execution_context()

通过TensorRT，我们可以将ONNX模型加载并进行优化，从而显著提高推理速度。

4.4 部署模型到生产环境

将模型部署到生产环境是深度学习工作流的最后一步。生产环境通常要求系统具备高可用性、容错能力和横向扩展性。

生产环境部署策略

微服务架构：通过将模型部署为微服务，可以实现模型的隔离、版本控制、负载均衡等功能。常用的部署框架包括Docker和Kubernetes，可以提供容器化部署和自动扩展能力。
API部署：通过构建RESTful API或gRPC服务，提供模型推理服务。用户可以通过API调用模型进行推理。
模型管理与监控：部署后，需要持续监控模型的性能，确保其在实际应用中的准确性和稳定性。此外，模型版本控制和滚动更新也非常重要，能够确保系统的高可用性和一致性。

完——

至此结束——

我是云边有个稻草人

期待与你的下一次相遇。。。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
程翔授《评价一篇记叙文》行吟斯基
桂林十一中高一2中学生自读程老师学生文章板书课题师巡看。看完举手。问：它是记叙文。不商量。独立打分。学生评价打分。师：高低都正常，不受干扰。师巡，略评。打完举手。调查：分层次举手——高分先举手。最低分。最高95分。最低45分。女：差距太大！师：同一篇，相差55分。若是你的文章，愿落谁手？男：身临其境感觉。师：你有此经历？没也没关系。女：不优美……，结尾无升华……无感悟……师：辞藻不美？(师追问)男
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
自律打卡第四天：比昨天进步一点点花儿的念想
今天新闻我们县城又确诊了一例，截止目前已经确诊的三例了，打开，看了一篇简友写的武汉的真实情况，有病住不了院，还没等到床位已经去世的消息，心里更加的难受，武汉尚且这样，如果是我们这没有高速没有火车的十八线的小县城发生这种情况，那情况将是更加的不堪设想，不敢想，唯有祈求灾难早点快去，平安才是最大的福气。突然觉得我的自律打卡，比昨天进步一点点。更希望疫情战争每一天都要比昨天好一点，希望一觉醒来听到的是好
15个小技巧，让我的Windows电脑更好用了！曹元_
01.桌面及文档处理第一部分的技巧，主要是围绕桌面的一些基本操作，包括主题设置、常用文档文件快捷打开的多种方式等等。主题换色默认情况下，我们的Win界面可能就是白色的文档界面，天蓝色的图表背景，说不出哪里不好看，但是就是觉得不够高级。imageimage说到高级感，本能第一反应就会和暗色模式联想起来，如果我们将整个界面换成黑夜模式的话，它会是这样的。imageimage更改主题颜色及暗色模式，我们
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
月光下的罪恶（5）允歌玖沐
5.被孤立顾纨是转校过来的，进入学校后，回头率很高“诶诶诶，你看那女生，哪个系的？”“不知道没见过。”“看那样，一看就是个胆小的货。”顾纨当做没听到，更狠的话她都听过，更何况女生们耍心眼？“他爸爸是做黑生意的，估计女儿也不是什么好的，你以后离他一家子远点。”她走向自己要上课的教室，一进门，所有人的目光看向她，顾纨若无其事的走进教室，开始上课。下课，一群人站起来，但是很显然，她周围的一圈人都不愿意和
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
贝多芬诞辰250周年纪念万千星河赴远方
就算不是古典音乐爱好者，你也一定听说过贝多芬。作为古典音乐史上最伟大的音乐家之一，他不仅是古典主义风格的集大成者，同时也是浪漫主义风格的开创者。贝多芬肖像画（1813年）贝多芬的一生共创作了9部交响曲、36首钢琴奏鸣曲、10部小提琴奏鸣曲、16首弦乐四重奏、1部歌剧及2部弥撒曲等等。数量虽然不及前辈海顿、莫扎特多，但他几乎改造了当时所有的音乐表达形式，赋予了它们全新的价值，对后世音乐的发展产生了极
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
三件事—小白猫·雨天·八段锦咸鱼月亮
1.最近楼下出现一只非常漂亮的粘人小白猫，看着不像是流浪猫，非常亲人。眼睛比蓝球的还大，而且是绿色的，很漂亮。第一次遇到它，它就跟我到电梯口，如果我稍微招招手，肯定就跟我进电梯了。后来我喂过它几次，好可惜不能养它，一只蓝球就是我的极限了。2.下雨天就心烦，好奇怪。明明以前我超爱看窗外的雨和听雨声，看来近来的心情不够宁静了。3.最近在练八段锦，从第一次就爱上了这个运动，很轻松缓慢，但是却出汗。感觉可
25-1-2019 树藤与海岛呢
hello八月来报道了今天看到了一篇文章就只想记下那两句话：良田千顷不过一日三餐广夏万间只睡卧榻三尺大概的意思就是要珍惜当下不要等来不及的时候才珍惜分享今天的两餐最近没有时间运动呢下个月补回好了说完了哈哈goodnight图片发自App图片发自App
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
力扣热题100-------54. 螺旋矩阵海航Java之路力扣 leetcode 矩阵 java
给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[1,2,3,6,9,8,7,4,5]示例2：输入：matrix=[[1,2,3,4],[5,6,7,8],[9,10,11,12]]输出：[1,2,3,4,8,12,11,10,9,5,6,7]提示：m==matrix.lengthn
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
SpringMVC执行流程（原理），通俗易懂国服冰 SpringMVC spring mvc
SpringMVC执行流程（原理），通俗易懂一、图解SpringMVC流程二、进一步理解Springmvc的执行流程1、导入依赖2、建立展示的视图3、web.xml4、spring配置文件springmvc-servlet5、Controller6、tomcat配置7、访问的url8、视图页面一、图解SpringMVC流程图为SpringMVC的一个较完整的流程图，实线表示SpringMVC框架提
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
现在发挥你的优势爱生活的佑嘉
来和我做咨询的一些朋友，涉及到定位的，都会说，我不知道我的优势是什么，你能不能帮我看看？还有一些朋友，喜欢做各种测试来了解自己，测试过后，然并卵。今天，我想来聊聊优势，如何能了解自己的优势是什么。首先，我们要知道，如果要成为“不一般”的人，我们所做的事情，就要基于自身的优势。我做管理者十多年，看到每个员工都有不同的特长，有的擅长数字，有的擅长人际，有的擅长写作。这些知道自己优势并且在这方面刻意练习
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
48. 旋转图像 - 力扣（LeetCode） Fiee-77 #数组 leetcode 算法 python 数据结构数组
题目：给定一个n×n的二维矩阵matrix表示一个图像。请你将图像顺时针旋转90度。你必须在原地旋转图像，这意味着你需要直接修改输入的二维矩阵。请不要使用另一个矩阵来旋转图像。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[[7,4,1],[8,5,2],[9,6,3]]示例2：输入：matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

“ 重磅揭秘：如何打造超高效的机器学习系统，释放大模型潜力？”

引言

一、大模型的定义与特点

1.1 大模型的定义

1.2 大模型的特点

二、机器学习系统的架构设计

2.1 系统架构概述

2.2 数据处理与管道设计

数据预处理与特征工程

数据存储与分发

2.3 分布式计算与并行化

2.4 高效存储和模型管理

三、大模型的训练与优化

3.1 训练大模型所需的资源

3.2 模型并行化技术

3.3 参数共享与模型压缩

四、模型部署与推理

4.1 推理引擎的选择

推理引擎的选择标准

常见推理引擎

4.2 模型量化与剪枝

模型量化

剪枝

示例：量化模型

4.3 推理加速与硬件优化

4.4 部署模型到生产环境

你可能感兴趣的:(热门文章,机器学习,人工智能,大模型,模型部署与推理,机器学习系统的架构设计,数据处理与管道设计,大模型的训练与优化)