观熵

企业级多租户环境下的 cgroup 精细化调控实践：容器资源隔离与性能优化全流程解析

关键词：
多租户隔离、cgroup v2、容器资源限制、CPU/内存控制、容器调度、QoS 策略、Linux 内核调优、容器平台优化、资源突发治理、LLM 推理容器管理

摘要：
在大型企业级私有部署场景中，多租户架构下的大模型推理系统对资源隔离与服务稳定性提出了极高要求。如何通过 Linux cgroup（control group）机制实现对 CPU、内存、IO 等资源的精细控制，是保障系统多租户安全与服务质量的核心路径。本文聚焦 2025 年最新容器调控技术与生产级调优实践，从 cgroup v2 的层级模型、容器资源隔离策略、调度优化路径，到 LLM 容器推理中的资源突发处理机制，系统解析如何构建一个高可控、高性能的多租户资源管理体系。适用于 AI 模型服务平台、企业内部低代码系统、RAG 网关服务、LLM Inference Mesh 等典型部署场景。

目录：

多租户模型服务环境资源管理挑战综述
Linux cgroup v1/v2 演进机制与容器运行时集成
容器 CPU/内存/IO 配额控制策略与动态限制机制
cgroup v2 层级调控实践：system.slice × kubepods.slice × user.slice
LLM 推理容器资源突发处理机制设计与压制策略
多租户 QoS 策略建模：BestEffort、Burstable 与 Guaranteed 机制实战
容器 runtime（containerd / CRI-O）与 cgroup 的集成调优路径
租户隔离下的资源争抢检测与 Throttling 追踪分析
异构资源环境下的 CPU SET 与 NUMA 策略部署实战
工程化落地案例：某金融多租户模型服务平台的资源隔离架构实现

1. 多租户模型服务环境资源管理挑战综述

在企业级 AI 模型服务系统中，多租户部署已成为私有化架构中的常态选择。尤其在大型组织内部，不同业务线、子系统、模型团队均需同时托管运行各自的大模型、微服务推理容器、向量检索模块等资源密集型组件，这对底层资源调度与隔离能力提出了极高要求。

1.1 多租户带来的典型资源调控挑战

资源抢占与性能抖动问题：多个租户共享宿主机物理资源，若一个租户模型出现大吞吐量推理请求，容易造成其它容器请求排队延迟，产生不可预期性能抖动。
显存与内存碎片化：LLM、RAG、Embedding 服务等模型推理任务对内存敏感，若未有效隔离与限制内存，可导致 host 层 OOM kill 或显存溢出。
CPU 争抢与 NUMA 不均衡调度：多核 NUMA 环境下，若多个容器同时分布在同一 NUMA 节点而调度不合理，将引发缓存错位和进程上下文频繁切换，拖慢整体推理时延。
安全与隔离的冲突问题：某些租户模型可能引入第三方推理插件或未审核代码，若资源调控机制缺失，则可能干扰其它关键推理模块，降低平台整体稳定性。

1.2 企业典型场景下的租户类型划分

模型服务租户（Model-as-a-Service）：不同业务线部署各自的大模型（如 Qwen、DeepSeek、Yi 系列），分别绑定独立 Endpoint，但共享宿主机资源。
流程引擎推理租户（Workflow LLM）：低代码平台下游自动触发的推理任务（如审批意图识别、文本纠错），推理量突发，资源动态弹性。
Agent 服务租户（多 Agent 并发）：Agentic AI 应用中同一用户触发多个模型并行执行，若无 QoS 策略将导致节点饱和甚至 LLM OOM。
研发测试租户：模型迭代与评估阶段大量消耗资源但不直接对业务开放，资源应严格限制，避免影响正式服务。

基于上述分析，构建基于 Linux cgroup 的多租户资源调控机制，是提升私有平台稳定性、服务质量与安全隔离能力的核心技术路径。

2. Linux cgroup v1/v2 演进机制与容器运行时集成

Control Group（简称 cgroup）是 Linux 内核提供的资源分组控制能力，支持对 CPU、内存、IO、线程数等资源做精细限制与度量。随着内核版本升级，cgroup 从 v1 发展至 v2，已成为容器平台资源管理的核心底座。

2.1 cgroup v1 与 v2 的核心区别

特性	cgroup v1	cgroup v2
层级模型	多子系统各自维护层级（如 `cpu`, `memory`）	所有资源统一在一个层级树
控制接口	各子系统各自独立设置	统一使用 `cgroup.controllers` 管理器
子 cgroup 行为	不自动继承父配置	可传播并支持精细化继承逻辑
系统集成性	对 QoS、负载限制较弱	支持更强 QoS 控制和调度策略
容器支持度	兼容旧系统，如 docker-ce 18.x	被 containerd、Kubernetes 主流版本默认支持

在当前（2025年5月）主流内核 5.15+ 和 Kubernetes 1.28+ 的环境中，cgroup v2 已被广泛启用，尤其是需要高性能隔离调度的 AI 推理场景，cgroup v2 的统一层级控制与资源继承机制成为默认配置。

2.2 容器运行时中的 cgroup 管理方式

以 containerd 为例，其对 cgroup 的集成流程如下：

Container Spec.yaml

CRI 配置 runtimeHandler

containerd 创建容器

调用 OCI Hook 写入 cgroup 配置

生成 /sys/fs/cgroup 下对应控制组

容器进程加入对应 cgroup 控制器

实际部署中，结合 systemd + containerd + cgroup v2，可实现统一的资源限制策略设置，并通过 kubepods.slice 对 Kubernetes Pod 实现分级管理。

2.3 当前主流容器平台对 cgroup v2 的支持情况（2025年Q2）

平台	cgroup v2 支持状态	支持级别
Kubernetes v1.28+	默认启用 v2，完全支持 QoS 管理	✅ 高
containerd v1.7+	完全支持 v2，集成 systemd 启动器	✅ 高
Docker Engine v24+	默认采用 v2，旧版本需手动开启	✅ 中高
CRI-O	支持完全，推荐 systemd cgroup driver	✅ 高

3. 容器 CPU/内存/IO 配额控制策略与动态限制机制

在多租户私有部署环境中，模型服务容器对 CPU、内存与块设备 IO 的使用必须实现配额分配与动态限速控制，才能有效规避资源抢占与性能抖动问题。cgroup v2 提供了更简洁统一的方式控制各类资源，尤其适用于对 LLM 推理容器进行低延迟、高可用的资源管理。

3.1 CPU 资源限制机制与调度权重设计

CPU 控制器主要通过以下三种策略限制容器 CPU 使用：

cpu.max：硬性限制容器使用的 CPU 时间片，例如 cpu.max=50000 100000 表示每 100ms 只能使用最多 50ms，即限制为 0.5 个 CPU 核心。
cpu.weight：调度比例权重机制（v2专属），在所有 Pod 达上限之前，按权重比例进行公平调度，范围 1～10000。
cpu.idle（可选）：用于容器是否允许在系统空闲时“超用”CPU。

实践建议：对负载高峰不确定的推理服务容器设置 cpu.max + cpu.weight 双重限制，既避免抖动也保障调度公平性。

3.2 内存资源控制与 OOM 抑制机制

内存控制器提供以下关键参数：

memory.max：容器最大可用内存，超过即触发 OOM。
memory.high：软限制，超过该值时可能被限制速度，但不会立即 kill。
memory.swap.max：设置 swap 上限，防止因交换空间被过度使用造成 I/O 拖慢。
memory.oom.group：是否将整个 cgroup 作为 OOM 处理的一个单位。

实践经验：部署大模型时，需根据 max GPU memory + batch size × intermediate CPU memory 来动态评估 memory.max，结合 Prometheus 监控提前预警。

3.3 IO 速率与块设备调控策略

块设备调控可通过 io.max 精确设定：

echo "8:0 rbps=10485760 wbps=10485760" > /sys/fs/cgroup/<cgname>/io.max

此命令限制 /dev/sda 上的读写速率分别为 10MB/s，适用于高频日志写入、向量库大规模同步等场景。

若需对模型热更新/缓存预加载设定延迟优先级，可配合 ionice 实现进程优先级控制。

3.4 动态限制与弹性扩缩容联动机制

通过 Kubernetes 的资源管理组件（如 VPA、KEDA）结合下发的 cgroup 控制策略，可以实现推理服务资源的动态压缩与弹性伸展：

监控指标上报

模型服务部署

推理请求突增

HPA/KEDA 扩容

下发新 Pod + 调整 CPU/内存 cgroup

在边缘节点、裸机 GPU 集群中也可通过定制化的 Python 守护进程监听容器负载变化动态修改 /sys/fs/cgroup/... 下配置，提升 QoS 响应效率。

4. cgroup v2 层级调控实践：system.slice × kubepods.slice × user.slice

cgroup v2 推行统一的控制树结构，并在 systemd 启动体系中构建了三大核心资源分配区域：

层级路径	适用类型	说明
`/sys/fs/cgroup/system.slice`	系统服务	systemd 启动的后台守护进程，如 `docker.service`, `kubelet.service` 等
`/sys/fs/cgroup/kubepods.slice`	Kubernetes Pod	所有 Kubernetes 管理的容器进程，包含 per QoS 的子层级
`/sys/fs/cgroup/user.slice`	用户交互	shell 交互 session、后台登录进程、调试脚本等

4.1 systemd 管理下的 cgroup 树形结构

以一个运行在 containerd + Kubernetes 环境的容器为例，其完整层级结构如下：

/sys/fs/cgroup/
└── kubepods.slice
    ├── kubepods-burstable.slice
    │   └── kubepods-burstable-pod<uid>.slice
    │       └── cri-containerd-<container-id>.scope
    ├── kubepods-best-effort.slice
    └── kubepods-guaranteed.slice

这使得管理员或调度器可以对不同 QoS 类别的 Pod 统一施加控制策略。例如：

echo "cpu.weight=200" > /sys/fs/cgroup/kubepods.slice/kubepods-burstable.slice/cpu.weight

即可动态控制某类租户的总体调度权重。

4.2 手动精调 system.slice 与 user.slice 资源限制

部分企业在自建推理平台中仍保留非容器服务（如 nginx + tritonserver 的组合），此类进程一般位于 system.slice，需手动配置其资源策略：

# 示例：限制 systemd 启动的 tritonserver 使用不超过 2 个核心
systemctl set-property tritonserver.service CPUQuota=200%

同理，对于部分研发调试进程所在的 user.slice，可适当降低 cpu.weight，防止干扰正式服务：

echo "cpu.weight=50" > /sys/fs/cgroup/user.slice/cpu.weight

4.3 与容器编排系统协同的推荐策略

调控层级	推荐控制方式	管理工具
kubepods.slice	Kubernetes QoS + VPA + cgroup 参数挂载	kubelet, containerd
system.slice	systemd 参数自动注入 + 配置文件持久化	`systemctl set-property`
user.slice	shell 自动注入脚本限制	`pam_limits`, `cgexec`

综合来看，cgroup v2 与 containerd/Kubernetes 的深度集成，使企业能够在统一的平台层级下实现多租户推理服务的细粒度资源隔离与弹性控制。接下来将深入分析具体场景下的租户 QoS 级别划分与自定义调度策略实践。

5. LLM 推理容器资源突发处理机制设计与压制策略

在企业级多租户部署场景下，LLM 推理容器经常因上下文长度波动、请求量暴增或复杂任务触发而引发 CPU 和内存资源的突发使用。若不进行合理压制，会造成节点整体资源拥堵，影响同节点其他租户稳定性。因此必须构建基于 cgroup v2 与 Kubernetes 控制器的突发处理机制。

5.1 识别突发模式：推理负载特征建模

根据实践经验，LLM 推理任务的资源突发具有以下特点：

CPU 峰值出现于前向推理首轮，尤其是多轮多模态输入合并时；
内存激增通常由 context 拼接与长序列 attention 计算触发；
显存压力与 CPU Swap 联动，模型权重部分卸载后反向加载导致 host memory 溢出。

结合 Prometheus + cAdvisor 指标分析，建议通过如下指标做突发识别：

container_cpu_usage_seconds_total
container_memory_working_set_bytes
container_fs_reads_bytes_total
container_oom_events_total

并以 95 percentile + sliding window 算法识别突发趋势：

TriggerCondition = CPUUsage > (P95 + ΔThreshold) for 3 windows

5.2 cgroup 限速机制：动态冻结与负载削峰

当突发模式被识别后，结合 cgroup v2 提供的“动态冻结”机制（freezer）与 I/O 限速参数，可快速对单容器进行压制：

CPU/内存冻结：echo 1 > /sys/fs/cgroup//cgroup.freeze
降速执行：调低 cpu.max，如从 200000 1000000 降为 50000 1000000
I/O 限流：降低 io.max 值，限制对本地缓存盘的读写速率

此外，使用 systemd 服务控制下容器可执行：

systemctl set-property <svc>.service CPUQuota=25% MemoryMax=2G

快速压制峰值容器行为。

5.3 突发场景下的优雅降级路径

建议结合 Nginx/In-Band Proxy 建立模型推理的降级路由体系：

是

否

用户请求

节点资源是否充足

主模型服务 A

轻量化模型服务 B

主服务与降级服务使用不同权重容器绑定，轻量模型使用少量显存+CPU，提升稳定性。

6. 多租户 QoS 策略建模：BestEffort、Burstable 与 Guaranteed 机制实战

Kubernetes 提供了三种资源分配 QoS 策略，用于支持多租户模型服务的差异化部署能力。企业在多模型共存、多业务共平台运行的环境中，可根据推理服务 SLA 等级配置对应的 QoS 策略，从而实现资源级别的隔离与服务级的稳定保障。

6.1 QoS 等级原理与容器分层机制

等级	描述	要求
BestEffort	无任何资源请求/限制	容易被抢占，优先级最低
Burstable	设置 request，不设置 limit 或 limit > request	中等优先级
Guaranteed	request = limit 且必须设置	独占资源，优先级最高

示例 YAML 配置：

resources:
  requests:
    cpu: "500m"
    memory: "2Gi"
  limits:
    cpu: "500m"
    memory: "2Gi"

上例即为 Guaranteed 类型，适合对稳定性要求高的核心推理服务使用。

6.2 多租户场景下的策略划分建议

服务类型	推荐 QoS	应用场景
核心 LLM 服务（如主模型）	Guaranteed	提供稳定、低延迟的服务
非核心模型、候选模型	Burstable	持续运行但可被抢占
Debug、测试模型	BestEffort	仅用于临时性任务

结合 kubepods.slice 的资源隔离层级，可将 QoS 类型映射到 cgroup v2 路径下，并设置专属资源调控策略。

6.3 实战经验与细粒度策略配置

推荐实践：

Guaranteed 容器：使用静态 CPU 绑定（CPU pinning），并固定 NUMA 节点内存，提升推理效率；
Burstable 容器：允许 CPU 动态伸缩，配合 cpu.weight 优化调度公平性；
BestEffort 容器：使用 nodeSelector 安排到低优先节点上，并设置 priorityClassName: low 避免抢占核心节点资源。

可使用如下命令查看当前 Pod 所处的 QoS：

kubectl get pod <pod-name> -o=jsonpath='{.status.qosClass}'

通过合理的 QoS 策略建模与资源层级控制，企业可实现在共享底层集群资源的前提下，保障不同等级 LLM 服务之间的可预测性与稳定运行，为多租户场景中的资源优化提供有力支撑。

7. 容器 Runtime（containerd / CRI-O）与 cgroup 的集成调优路径

在多租户部署环境中，容器运行时（Runtime）作为连接 Kubernetes 和 Linux 系统资源隔离机制的桥梁，其对 cgroup v2 支持的完善程度、性能配置能力和调用链效率，直接决定了模型推理容器的资源控制精度与运行稳定性。

7.1 主流容器 Runtime 的 cgroup v2 支持现状（2025 年 5 月）

截至 2025 年 5 月：

containerd（v1.7+）：已原生支持 cgroup v2，支持 Unified Cgroup Hierarchy 模式；
CRI-O（v1.30+）：官方声明全面支持 systemd driver 与 cgroup v2；
dockershim 已废弃：不推荐使用，社区维护终止。

推荐配置 containerd 时启用 systemd 驱动：

[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options]
  SystemdCgroup = true

并在 kubelet 配置中统一 cgroup 驱动：

--cgroup-driver=systemd
--cgroups-per-qos=true
--enforce-node-allocatable=pods

7.2 containerd 的资源调优路径实战

containerd 的 cgroup 调优应从以下方面入手：

Runtime Hook：利用 container lifecycle hook 实现资源限速、quota 设置与 PID 限制；
runc shim 传参控制：在运行容器前通过 CRI 配置注入如下参数：

"linux": {
  "resources": {
    "cpu": {
      "shares": 512,
      "quota": 200000,
      "period": 1000000
    },
    "memory": {
      "limit": 4294967296
    }
  }
}

OOM Behavior：设置 memory.swap.max 与 memory.oom.group，避免多个租户 OOM 互相波及：

echo 0 > memory.swap.max
echo 1 > memory.oom.group

7.3 CRI-O 优化路径与落地经验

对于选型 CRI-O 的系统，推荐关注以下关键配置：

--enable-cgroupv2
--cgroup-manager=systemd

并通过 crio.conf 中的资源控制配置段设置默认限制：

[crio.runtime]
  default_ulimits = ["nofile=1024:4096"]
  conmon_cgroup = "pod"

此外，建议启用沙箱进程 PID 限制及 CPU set 隔离，提升调度可控性。

8. 租户隔离下的资源争抢检测与 Throttling 追踪分析

多租户推理服务场景中，常常存在低优先租户容器占用资源过多，导致高优先容器被限速（Throttle）的问题。为了识别此类问题，必须构建系统级资源争抢检测机制与限速链路分析体系。

8.1 Kubernetes + cAdvisor + Prometheus 指标整合

以下指标可用于识别资源争抢问题：

CPU 限速事件：

container_cpu_cfs_throttled_periods_total
container_cpu_cfs_throttled_seconds_total

内存压力观察：

container_memory_working_set_bytes
container_memory_failcnt

磁盘 IO 争用指标：

container_blkio_throttle_io_serviced_total

可通过 Prometheus 查询以下表达式定位资源争抢 Top 容器：

topk(5, rate(container_cpu_cfs_throttled_seconds_total[1m]))

8.2 eBPF + BCC 工具链辅助深度分析

通过 eBPF 实现内核态 Throttling 追踪。推荐工具：

cgroup-iostat：分析 cgroup 内 I/O 服务时间；
runqlat：调试 CPU run queue 延迟；
biolatency：捕获块设备延迟分布。

示例命令：

sudo bpftrace -e 'tracepoint:sched:sched_stat_wait /pid == 12345/ { @[comm] = hist(args->delay); }'

结合 BPFTrace 可生成实时资源竞争可视化图谱。

8.3 多租户隔离策略联动调控

当识别出资源争抢趋势后，可采取如下调控策略：

调整租户 QoS 等级与限速参数；
将租户分布于不同 NUMA 结构的节点；
结合 cgroup.weight 精准压制不守规矩租户；
动态迁移 Pod 至低负载节点（配合 descheduler）；

流程图如下：

是

否

识别资源争抢

Prometheus + eBPF 数据分析

是否存在热点容器

调整 QoS / 限速配置

保持策略不变

动态调度或压制

通过整合 Kubernetes 指标体系、Runtime 限制能力与内核态监控机制，企业可在多租户推理系统中精准定位资源争抢源，执行动态压制与调度迁移，保障核心业务模型在负载高峰期的稳定性与可用性。

9. 异构资源环境下的 CPU SET 与 NUMA 策略部署实战

在多租户 LLM 推理平台中，为了实现更稳定的性能隔离与资源利用最大化，必须结合 CPU SET 与 NUMA 策略进行精准调度。尤其在 GPU+CPU+NPU 混合部署或大节点 NUMA 分区场景下，资源亲和性配置直接决定推理吞吐与延迟波动。

9.1 NUMA 拓扑理解与性能影响因素

NUMA（非一致性内存访问）架构中，不同物理 CPU（Socket）和其直连内存之间的访问延迟、带宽差异较大。若容器或 Pod 的 CPU 与内存跨 NUMA Node 配置，将引发：

数据访问延迟增加；
Cache miss 上升；
内存带宽拥堵；
推理吞吐不稳定。

推荐使用如下命令查看系统 NUMA 拓扑：

lscpu | grep NUMA
numactl --hardware

输出示例：

NUMA node0 CPU(s):     0-15
NUMA node1 CPU(s):     16-31
NUMA node0 size:       128000 MB
NUMA node1 size:       128000 MB

9.2 Kubernetes CPU 管控：cpuset + numa-aware 调度

Kubernetes 支持通过 TopologyManager 实现 NUMA 感知调度。开启方式：

--topology-manager-policy=best-effort
--cpu-manager-policy=static

静态 CPU 管理器可为 Guaranteed QoS Pod 绑定独占 CPU 核心，结合 CRI runtime 自动绑定 NUMA：

resources:
  requests:
    cpu: "4"
  limits:
    cpu: "4"

Pod 被分配固定 CPU 核心后，即可利用 cpuset 控制器隔离到单个 NUMA Node。

9.3 NUMA 感知部署：推理容器调度规范

建议在调度推理容器时执行以下实践：

统一配置 Pod Topology Hints，显式亲和目标 NUMA node；
配置 --reserved-cpus 绑定系统组件至 node0，业务 Pod 固定于 node1；
业务 GPU 容器启用 CPU pinning，避免在 NUMA Node 间跨访内存；
配合 Intel RDT（Resource Director Technology）调控 L3 Cache 使用，提升 cache 命中率。

示例调度策略：

spec:
  topologySpreadConstraints:
    - maxSkew: 1
      topologyKey: "kubernetes.io/hostname"
      whenUnsatisfiable: DoNotSchedule

结合 PodAnnotation 传递 NUMA 亲和提示或通过自定义调度器控制调度域。

10. 工程化落地案例：某金融多租户模型服务平台的资源隔离架构实现

以下是 2025 年某金融科技公司部署多租户模型推理平台的真实工程实践方案，目标是在高频交易、风险建模、信贷审批等子系统中部署数十个模型副本，并确保模型间资源隔离与运行稳定性。

10.1 项目背景与挑战

金融模型具备不同级别 SLA 与服务窗口（实时 vs 批处理）；
多租户系统必须保障模型调用不互相干扰；
高性能 CPU+GPU 混合集群异构，存在 NUMA 非对称拓扑；
高可用需求，需支持节点级容灾与副本快速恢复；
系统需对每个租户精准计费、统计资源使用。

10.2 架构设计与核心策略

架构核心以 Kubernetes 为调度中心，配置如下资源隔离机制：

QoS 策略：核心模型设为 Guaranteed，辅助模型设为 Burstable；
CPU/内存配额管理：通过 requests/limits 配置控制资源上限与调度粒度；
NUMA 策略配置：重要模型部署前预估内存访问模式，绑定至 node1；
Pod 配置隔离：
- 使用 static CPU 管理策略；
- 配合 CRI-O 设定独立 cgroup slice；
容器层配置：为容器注入如下 CPU/内存亲和配置：

"linux": {
  "resources": {
    "cpu": {
      "cpus": "16-23"
    },
    "memory": {
      "limit": 4294967296
    }
  }
}

10.3 关键指标与效果

平均每个租户推理任务 CPU 抖动减少 72.3%；
推理响应稳定性 P99 减少 40+ ms；
每月资源争抢事件从 83 次降至 <5 次；
通过 Prometheus + Grafana 构建出资源使用仪表板，提供租户级别资源用量报告；
支持动态资源扩缩，自动伸缩模型副本与容器 CPU 限额。

10.4 部署流程图

用户提交模型部署请求

模型编排服务解析资源需求

调用 Kubernetes API 动态调度 Pod

Pod 注入 NUMA+CPU 亲和配置

Containerd 加载推理容器

Prometheus 持续监控资源使用

租户资源使用报告定期生成

该案例展示了在金融业务多租户环境中，如何通过 Kubernetes、NUMA 策略、cgroup 隔离机制协同构建高可控、高吞吐且具备租户独立性的模型推理平台，实现资源利用效率提升与业务 SLA 的精准保障。

个人简介

作者简介：全栈研发，具备端到端系统落地能力，专注人工智能领域。
个人主页：观熵
个人邮箱：[email protected]
座右铭：愿科技之光，不止照亮智能，也照亮人心！

专栏导航

观熵系列专栏导航：
AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到AI在行业中的落地应用，我们将深入剖析最前沿的AI技术，分享实用的开发经验，并探讨AI未来的发展趋势
AI开源框架实战：面向 AI 工程师的大模型框架实战指南，覆盖训练、推理、部署与评估的全链路最佳实践
计算机视觉：聚焦计算机视觉前沿技术，涵盖图像识别、目标检测、自动驾驶、医疗影像等领域的最新进展和应用案例
国产大模型部署实战：持续更新的国产开源大模型部署实战教程，覆盖从模型选型 → 环境配置 → 本地推理 → API封装 → 高性能部署 → 多模型管理的完整全流程
Agentic AI架构实战全流程：一站式掌握 Agentic AI 架构构建核心路径：从协议到调度，从推理到执行，完整复刻企业级多智能体系统落地方案！
云原生应用托管与大模型融合实战指南
智能数据挖掘工程实践
Kubernetes × AI工程实战
TensorFlow 全栈实战：从建模到部署：覆盖模型构建、训练优化、跨平台部署与工程交付，帮助开发者掌握从原型到上线的完整 AI 开发流程
PyTorch 全栈实战专栏： PyTorch 框架的全栈实战应用，涵盖从模型训练、优化、部署到维护的完整流程
深入理解 TensorRT：深入解析 TensorRT 的核心机制与部署实践，助力构建高性能 AI 推理系统
Megatron-LM 实战笔记：聚焦于 Megatron-LM 框架的实战应用，涵盖从预训练、微调到部署的全流程
AI Agent：系统学习并亲手构建一个完整的 AI Agent 系统，从基础理论、算法实战、框架应用，到私有部署、多端集成
DeepSeek 实战与解析：聚焦 DeepSeek 系列模型原理解析与实战应用，涵盖部署、推理、微调与多场景集成，助你高效上手国产大模型
端侧大模型：聚焦大模型在移动设备上的部署与优化，探索端侧智能的实现路径
行业大模型 · 数据全流程指南：大模型预训练数据的设计、采集、清洗与合规治理，聚焦行业场景，从需求定义到数据闭环，帮助您构建专属的智能数据基座
机器人研发全栈进阶指南：从ROS到AI智能控制：机器人系统架构、感知建图、路径规划、控制系统、AI智能决策、系统集成等核心能力模块
人工智能下的网络安全：通过实战案例和系统化方法，帮助开发者和安全工程师识别风险、构建防御机制，确保 AI 系统的稳定与安全
智能 DevOps 工厂：AI 驱动的持续交付实践：构建以 AI 为核心的智能 DevOps 平台，涵盖从 CI/CD 流水线、AIOps、MLOps 到 DevSecOps 的全流程实践。
C++学习笔记？：聚焦于现代 C++ 编程的核心概念与实践，涵盖 STL 源码剖析、内存管理、模板元编程等关键技术
AI × Quant 系统化落地实战：从数据、策略到实盘，打造全栈智能量化交易系统
大模型运营专家的Prompt修炼之路：本专栏聚焦开发 / 测试人员的实际转型路径，基于 OpenAI、DeepSeek、抖音等真实资料，拆解从入门到专业落地的关键主题，涵盖 Prompt 编写范式、结构输出控制、模型行为评估、系统接入与 DevOps 管理。每一篇都不讲概念空话，只做实战经验沉淀，让你一步步成为真正的模型运营专家。

如果本文对你有帮助，欢迎三连支持！

点个赞，给我一些反馈动力
⭐ 收藏起来，方便之后复习查阅
关注我，后续还有更多实战内容持续更新

你可能感兴趣的:(性能优化,人工智能)

Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
程序员必备：10 个提升代码质量的工具大力出奇迹985 宠物
在软件开发过程中，代码质量对项目的成功起着决定性作用。高质量的代码不仅易于维护和扩展，还能有效降低成本并提升可靠性。本文精心挑选了10个程序员必备工具，助力提升代码质量。这些工具涵盖代码格式化、静态分析、代码审查、测试、性能优化、安全扫描、版本控制、依赖管理、代码生成以及文档生成等多个关键领域。通过使用它们，开发者能够高效地发现并解决代码中的潜在问题，遵循最佳实践，提升代码的可读性、可维护性与安全
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
Serverless架构下Spring Function的创新实践 tmjpz04412 serverless 架构 spring
引言：Serverless与Spring生态的交汇背景介绍：云计算与Serverless架构的兴起Spring生态的演进与云原生适配性核心问题：传统Spring应用如何融入Serverless范式Serverless架构的核心特征与挑战事件驱动、弹性伸缩与按需计费冷启动问题与性能优化需求Spring应用在Serverless环境中的典型瓶颈（如依赖注入、上下文初始化）SpringFunction的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
OpenCloudOS 城市行·成都站圆满落幕，共探操作系统技术新未来！ CSDN资讯业界资讯资讯数据库人工智能
7月26日，由OpenCloudOS社区主办，海光信息战略合作的OpenCloudOS城市行・成都站活动在成都欧洲中心圆满举办，线上观看人次超3万。当前，数字化浪潮席卷全球各行各业，在国产化进程加速的背景下，操作系统的技术突破与生态构建不仅是保障信息安全的关键，更是推动产业升级、实现高质量发展的必由之路。然而，国产操作系统在性能优化、安全防护、多场景适配等方面仍面临诸多挑战，亟需产业链上下游协同创
涵盖轻量级锁（SpinLock）与操作系统同步原语（如 CRITICAL_SECTION）的性能优化、Monitor 的原子性和数据竞争防护、Monitor.Wait 和 Pulse 在生产者-消费者 zhxup606 C#实战教程李工篇 wpf 开发语言 C#
涵盖轻量级锁（SpinLock）与操作系统同步原语（如CRITICAL_SECTION）的性能优化、Monitor的原子性和数据竞争防护、Monitor.Wait和Pulse在生产者-消费者中的作用、控制线程执行顺序、Thread.Join的含义、避免嵌套锁的锁顺序策略，以及防止伪唤醒的条件检查。每个问题包括核心概念、实现细节、与之前讨论的关联（如线程池、进程间同步、分布式同步）、代码示例、测试用
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
大厂都在用的前端缓存策略，你掌握了吗？ AI架构全栈开发实战笔记前端缓存 ai
大厂都在用的前端缓存策略，你掌握了吗？关键词：前端缓存、HTTP缓存、ServiceWorker、CDN缓存、缓存策略、性能优化、浏览器缓存摘要：本文将深入探讨前端开发中常用的缓存策略，从浏览器缓存到ServiceWorker，从HTTP缓存头到CDN缓存，全面解析大厂都在使用的高效缓存技术。通过生动的比喻和实际代码示例，帮助开发者理解并掌握这些提升Web应用性能的关键技术。背景介绍目的和范围本文
【服务器知识】nginx配置ipv6支持问道飞鱼服务器相关服务器 nginx 网络 ipv6
nginx配置ipv6支持Nginx全面支持IPv6配置指南一、基础IPv6配置1.启用IPv6监听2.IPv6地址格式说明二、高级IPv6配置1.双栈配置优化2.IPv6访问控制3.IPv6反向代理三、SSL/TLS配置1.IPv6SSL证书配置2.HSTS包含IPv6四、性能优化1.内核参数调优2.Nginx调优参数五、安全加固1.IPv6DDoS防护2.防止地址欺骗六、IPv6测试与诊断1.
H5UI微信小程序前端框架实战指南 ai
本文还有配套的精品资源，点击获取简介：H5UI是一个为微信小程序开发设计的前端框架，基于H5技术，提供简洁高效的组件库。框架集成了丰富的UI元素，如按钮、表格、导航栏等，简化了界面布局和交互的实现。通过安装、引入、使用组件和事件绑定四个步骤，开发者可以轻松构建功能齐全的应用。了解性能优化等注意事项对于高效开发同样重要。1.微信小程序前端开发框架介绍微信小程序概述微信小程序是微信官方推出的一种无需下
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
Python 中的 JWT 认证：从生成到验证的完整指南盛夏绽放 python 开发语言有问必答后端
文章目录Python中的JWT认证：从生成到验证的完整指南一、JWT是什么？为什么需要它？传统session与JWT对比二、JWT的结构解析三、Python中实现JWT1.安装PyJWT包2.生成JWT3.验证JWT4.错误处理大全四、高级应用场景1.双令牌系统（Access+Refresh）详细说明表格：异常处理补充表：2.与FastAPI/Django集成五、安全最佳实践六、性能优化技巧算法性
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb