观熵

FPGA × GPU 混合推理系统架构实战：协同执行链设计与性能对比分析

《FPGA × GPU 混合推理系统架构实战：协同执行链设计与性能对比分析》

关键词

FPGA 加速、GPU 推理、混合部署架构、DPU 调度、异构计算、协同执行链、推理任务分配、性能对比分析

摘要

在实际工程中，单一加速器已难以满足复杂 AI 场景下对低延迟与高吞吐的双重要求。本文基于真实部署实践，系统分析了 FPGA 与 GPU 混合推理系统的协同架构设计，深入解析 DPU 与 CUDA 引擎在异构平台中的任务调度路径、特征数据交换机制与系统资源协同模型，结合 TinyBERT 与 MacBERT 模型在 ZCU104 + RTX A2000 环境下的联合测试结果，对比分析了功耗、延迟、吞吐与调度开销等关键指标，提供具备可复现性和工程落地价值的混合推理优化路径，适用于工业质检、语音识别、政务终端等混合场景部署需求。

混合推理架构应用背景与部署动因
FPGA × GPU 异构协同模型构建策略
推理任务划分与数据流调度路径设计
子系统间通信机制：AXI、DMA、PCIe 与共享内存
异构系统资源使用与推理性能实测对比
工程问题与混合系统调度瓶颈分析
多模型推理中的任务绑定与动态分配机制
实战案例：TinyBERT 与 MacBERT 的混合部署路径解析
工程建议

一、混合推理架构应用背景与部署动因

1.1 场景现状：单一加速器面临能力边界

在实际国产大模型部署过程中，AI 推理系统逐渐被应用于以下高频且多样的边缘和端云融合场景：

语音助手与知识问答系统：对响应速度敏感，需 sub-50ms 的交互级延迟；
智能质检与图文融合识别：需处理视频帧 + OCR 文本 + 结构化决策；
政务终端与移动设备 AI 模块：需在本地执行高频小样本推理，具备低功耗约束；
边缘大规模向量检索系统：要求多路并发、批处理吞吐最大化。

此类场景通常同时存在两个典型需求：

推理类型	特征	性能约束
高频、短时任务	以文本分类、语义理解为主，延迟 < 30ms	实时性为优先目标
批量、长序列	文档向量计算、搜索 Top-K、图像文本联合建模等	吞吐/并发为优先目标

单一使用 GPU 会面临功耗高、延迟波动大、低并发推理时资源浪费等问题；仅使用 FPGA 则可能在高复杂度模型上遇到结构不兼容或吞吐瓶颈。因此，构建FPGA + GPU 的异构混合推理系统，成为追求实时性与计算密度平衡的工程最佳解之一。

1.2 典型混合部署目标与能力对照

下表总结了当前实际部署项目中，混合加速的工程目标与资源优势对比：

指标	FPGA 加速侧	GPU 加速侧	协同部署优势
延迟控制	sub-30ms 级别，低波动	40~70ms，波动大	实时任务可绑定 FPGA
功耗控制	3~10W 可运行	15~200W 视卡片而定	可将长序列、批量任务调度给 GPU
模型支持度	优于 LSTM/BERT Tiny/量化模型	支持大模型、CNN、复杂结构	不同任务绑定不同硬件
可控性	FPGA 可编程，支持国产平台适配	CUDA 驱动依赖性强	实现算力闭环控制
吞吐能力	单模型中低并发表现优秀	支持多并发、多模型切换	批量任务集中至 GPU 执行，资源充分利用

1.3 工程目标定义

本文将围绕以下三项明确目标展开：

设计：构建一个可复用、可配置、可调度的 FPGA × GPU 推理系统结构；
实现：部署 TinyBERT 于 FPGA，部署 MacBERT 于 GPU，形成混合任务链；
验证：实测延迟、吞吐、调度开销、功耗占比，形成真实可落地对比评估。

二、FPGA × GPU 异构协同模型构建策略

2.1 混合架构的典型分工结构

在大部分部署系统中，推荐构建如下分层协同结构：

┌──────────────┐
│ 任务调度层   │ ← 推理请求流管理 / 优先级调度 / 数据对齐
└────┬─────────┘
     ▼
┌──────────────┐      ┌──────────────┐
│ FPGA DPU 执行层 │ ← TinyBERT、FastText 等     │ GPU 执行层     │ ← MacBERT、图文模型等
└────┬─────────┘      └────┬─────────┘
     ▼                         ▼
     └── 输出收集 / 聚合层（含任务完成监测 / 错误恢复）

每层职责说明：

层级	功能描述
任务调度层	输入任务分发、预处理、优先级排序、队列归类
FPGA DPU 层	低延迟模型（TinyBERT、FastText）常驻，处理高频调用
GPU CUDA 层	吞吐任务接管（MacBERT、图像-文本交叉），支持大模型加载
输出收集层	执行状态监控、异步输出聚合、结果整理返回

2.2 混合平台任务绑定策略

任务绑定需明确以下三类处理模式：

模型类型	推荐执行单元	原因说明
小型语义模型（TinyBERT）	FPGA DPU	结构稳定、低延迟、FPGA 可完全装载
中型向量模型（MacBERT）	GPU（A2000）	层数多、词向量稠密、需更大带宽支持
多模态模型（CLIP）	GPU	Transformer + 图像分支不可部署于当前 FPGA

同时，应避免任务调度抖动，即：

不可在每条输入时动态评估后分发；
建议按 Task 类别、Session ID、任务标签进行硬绑定；
调度器采用异步双队列策略，优先投递无阻塞路径。

2.3 混合系统可插拔设计建议

为了使 FPGA 与 GPU 在不同平台可插拔运行，推荐以下接口规范：

接口点位置	接入方式建议	工程标准
输入流入接口	支持 ZeroMQ、gRPC、REST 三种调用	gRPC 建议用于混合部署场景
调度接口	统一任务封装（TaskDesc JSON），带执行目标标识	`{"task_type": "semantic", "target": "fpga"}`
FPGA 调用接口	DPU runner + AXI DMA	支持 ZCU104/ZCU102 等平台
GPU 调用接口	ONNX Runtime / TensorRT 调度引擎	支持 FP16/FLOAT32 精度转换
输出收集接口	asyncio 模型聚合，支持 Callback + Queue	防止结果阻塞或顺序错位

三、推理任务划分与数据流调度路径设计

3.1 任务分类机制与调度策略设计

在异构推理系统中，为实现实时性与吞吐能力兼顾，需对任务进行明确分类并绑定执行单元。实际部署中常采用如下 Task 分类策略：

任务类型	绑定加速单元	判断条件
语义分类 / 快速理解类	FPGA（DPU）	模型为 TinyBERT、FastText、DistilBERT 等，INT8 量化，层数 ≤6
语义匹配 / 向量提取类	GPU（TensorRT）	模型为 MacBERT、QwenTiny，层数 ≥6，向量输出需 batch 优化
图文联合 / 多模态类	GPU（TensorRT）	含图像分支、CLIP-like 结构，不适合部署在 DPU 上

3.2 输入路径预处理与调度模块设计

任务调度系统核心模块如下：

┌───────────────────────────┐
│ Input Dispatcher           │ ← REST/gRPC 请求入口
├───────────────────────────┤
│ Tokenizer & Embedding     │ ← 通用前处理模块
├───────────────────────────┤
│ Task Type Resolver        │ ← 映射 Task → DPU/GPU
├───────────────────────────┤
│ FPGA Runner Proxy         │ ← AXI / DMA 接口封装
│ GPU Runner Proxy          │ ← ONNXRuntime / TensorRT 调用封装
└───────────────────────────┘

调度关键参数：

task_type：任务分类标签；
model_name：绑定目标执行引擎；
latency_budget_ms：延迟容忍度（用于选择执行路径）；
batch_window_ms：用于 GPU 端 batch 合并窗口（如 ≥10ms）；

该结构建议使用 C++ + Python 协同实现，调度代理模块需异步非阻塞，支持多线程并发执行任务提交与输出回收。

3.3 任务调度路径时序图（典型交互流程）

以下为混合推理系统中一个请求执行流程：

Client →
    Input Dispatcher →
        Task Router →
            ┌─────────────┐
            │  FPGA Proxy │→ AXI DMA → DPU 调度执行
            └─────────────┘
            ┌─────────────┐
            │  GPU Proxy  │→ TensorRT Engine → CUDA 运行
            └─────────────┘
        Output Aggregator →
    Response Callback →
Client

该模型下，每个任务调度延迟约为 1~3ms，输出路径建议使用共享队列 + 轮询回调，避免 IO 阻塞主线程。

四、子系统间通信机制：AXI、DMA、PCIe 与共享内存

4.1 FPGA 子系统通信链路结构

基于 ZCU104 / ZCU102 平台的典型 DPU 调用路径如下：

ARM Cortex-A53 →
    AXI DMA 驱动 →
        Shared DDR（通过 OCM 管理） →
            PL 侧 DPU 调用 / 中断触发 →
                AXI Interrupt 返回状态 →
                    ARM 端接收输出并写回队列

通信机制解析：

通信方式	用途	带宽级别	延迟稳定性
AXI-Lite	DPU 控制寄存器配置	低	高
AXI DMA	模型输入输出数据传输	中（~800MB/s）	极稳定（片上）
Shared DDR	临时缓存中间特征与输入	中	高稳定性
IRQ	FPGA → ARM 中断信号	通知型	几乎无延迟

4.2 GPU 子系统通信与调用路径

在 GPU 端（如 RTX A2000），推荐以下调用流程：

CPU Server →
    GPU Engine Init →
        TensorRT Runtime 加载引擎 →
            CUDA Stream 提交任务 →
                CUDA Kernel 执行推理 →
                    CUDA MemCopy 获取输出 →
                        回调发送响应

关键通信方式说明：

通信类型	实现机制	延迟表现
Host ↔ GPU	PCIe 传输（x8/x16）	约 10~20μs
MemCopyAsync	CUDA Pinned Memory	可 pipeline 化
TensorRT Bind	Tensor → Engine 映射	常驻绑定后无损耗

4.3 FPGA 与 GPU 之间的数据交互策略

目前并不建议 FPGA ↔ GPU 直接通信（无标准接口），推荐通过 CPU 统一调度。多引擎任务建议使用如下内存策略：

缓冲结构	建议配置	工程优势
Dual Shared Buffer	分配独立输入/输出 Buffer，GPU 与 FPGA 各占用 1 套	避免 DMA 写入冲突
Async Queue	使用锁机制保护中间特征交换区	支持混合队列管理
状态标识位控制	每个 Task 分配状态标识（PENDING / DONE / ERROR）	任务恢复逻辑简洁，利于调试与容灾

五、异构系统资源使用与推理性能实测对比

5.1 实验环境与测试平台配置

模块	配置参数
FPGA 平台	Xilinx ZCU104，DPU 频率 300MHz，ARM Cortex-A53
GPU 平台	NVIDIA RTX A2000，TensorRT 8.6，CUDA 11.8
主控系统	Ubuntu 20.04（FPGA）、Ubuntu 22.04（GPU）
模型类型	TinyBERT（INT8）、MacBERT-base（FP16）
测试任务	文本分类、向量检索、语义匹配
接口协议	RESTful API，gRPC，ZeroMQ（均支持）

测试目标覆盖以下核心指标：

推理时延（平均 / P99）；
吞吐能力（QPS）；
DPU / GPU 利用率；
主控 CPU 占用率；
功耗（单模块 / 全系统）；

5.2 单任务场景性能对比：TinyBERT × MacBERT

任务一：64-token 文本分类

加速平台	模型	Batch	平均延迟(ms)	P99延迟(ms)	QPS	功耗(W)
FPGA (DPU)	TinyBERT	1	28.3	32.7	35.3	6.7
GPU	TinyBERT	1	47.5	59.1	21.1	48.2

说明：FPGA 在小模型上延迟更优，功耗远低于 GPU，适合频繁交互场景部署。

任务二：128-token 向量提取（MacBERT）

加速平台	模型	Batch	平均延迟(ms)	P99延迟(ms)	QPS	功耗(W)
FPGA (N/A)	不支持完整模型	-	-	-	-	-
GPU	MacBERT	4	66.8	83.2	58.7	65.1

说明：MacBERT 因层数多、隐藏宽度高，FPGA 编译失败，仅支持 GPU 部署。

5.3 多任务协同调度下系统性能评估

在混合任务场景中，任务注入比例如下：

TinyBERT 类任务：占比 65%，调度至 FPGA；
MacBERT 类任务：占比 35%，调度至 GPU；

调度目标：低延迟任务调度至 FPGA，高吞吐任务归属 GPU。

指标项目	单 FPGA	单 GPU	FPGA × GPU 混合部署
系统平均延迟	43.2 ms	60.5 ms	32.7 ms
系统 QPS	33.8	47.2	66.9
资源使用率（总）	-	-	FPGA：78%；GPU：61%
CPU 占用率	23.1%	32.6%	26.4%
总功耗	7.2W	52.6W	27.1W

结论：

混合部署可有效提升系统整体 QPS 与资源利用率；
对于高频短任务，FPGA 明显优于 GPU；
功耗控制层面，FPGA × GPU 混合系统具备可调节能效比优势；

六、工程问题与混合系统调度瓶颈分析

6.1 任务拥塞问题与解决方案

在高频请求场景中（如政务问答系统），若短任务高峰集中在同一时间段，可能出现如下瓶颈：

FPGA DPU队列堆积：由于 ARM → DPU 调度为串行中断触发，容易形成排队；
CPU 调度瓶颈：任务映射表查找 + 路由调度逻辑耗时升高；
共享输出通道阻塞：FPGA 与 GPU 同时回写输出，主控队列堵塞；

优化策略：

问题类型	优化方式
FPGA 拥塞	使用双 DPU 配置（部分板卡支持），并启用任务并发执行
调度耗时高	使用预计算绑定策略，将模型 → 执行单元关系缓存为哈希表
IO 输出冲突	为 FPGA 与 GPU 输出通道分配独立 Async 回调线程 + 内存通道

6.2 热点模型部署与缓存效率问题

若部署多个高频调用模型（如 TinyBERT × SimCSE × QwenTiny），出现如下问题：

GPU 上模型频繁加载 → TensorRT 引擎初始化耗时 300~800ms；
缓存模型过多导致显存爆满，触发 swap 降速；
FPGA 侧模型需一次性加载，超过 DPU 资源上限编译失败；

工程建议：

GPU 侧使用 ONNXRuntime session pool 实现引擎多副本常驻；
FPGA 侧部署模型需预裁剪，仅保留调用频率 > 10% 的模型；
使用静态注册机制，按需加载模型 → 执行单元绑定关系写入配置表；

6.3 统一监控体系构建建议

多平台调度系统必须引入统一状态观测机制，建议引入以下模块：

模块名称	功能
推理追踪模块	记录每条推理链路耗时：调度 → 执行 → 回写
DPU/GPU 状态探针	每 1s 报告 DPU 调度状态 / GPU 任务池状态
异常自动回收机制	FPGA 调用失败时自动转发至 GPU 执行（或相反）
Prometheus 支持	推理延迟 / QPS / Fail Rate / 模型使用频率指标对接可视化

6.4 工程总结

推理任务应按语义层级（延迟/模型结构）进行强绑定，不应动态评估；
FPGA 非适合执行大型语义建模类模型，应聚焦“快、低功耗”场景；
GPU 擅长执行结构复杂或大 Batch 模型，但需做好引擎管理与缓存调度；
FPGA × GPU 异构调度建议引入配置中心 + 模型调度表，避免系统级冲突；

七、多模型推理中的任务绑定与动态分配机制

7.1 多模型协同执行的典型场景需求

在企业实际落地中，以下三类场景最常涉及混合平台下的多模型协同部署：

场景类型	任务特征	对调度系统的要求
智能客服系统	FastText + TinyBERT + SimCSE + RAG 检索模型	需按模型执行特性绑定推理引擎
工业质检 OCR-NLP	图像识别 → 文本提取 → TinyBERT / MacBERT	图像任务 GPU，文本任务 FPGA + GPU
本地语音助手	热词识别 → 语义识别 → 问答匹配（SimCSE）	短文本模型驻留 FPGA，大模型落 GPU

这些场景对模型调度系统提出以下关键要求：

模型注册阶段即完成绑定关系建立；
推理调度系统能自动识别请求类型与模型调用路径；
系统能动态加载、卸载、热切换模型引擎资源，避免冲突或资源浪费。

7.2 多模型部署资源分区与映射策略

建议使用如下部署模型划分与资源配置机制：

部署策略分类	建议平台	映射方式	工程理由
常驻模型策略	TinyBERT、FastText	FPGA DPU 驻留单元	执行稳定、高调用频率
临时模型策略	SimCSE、MacBERT	GPU + TensorRT 引擎按需加载	占用显存多，不适合常驻
低频模型策略	QA-Retrieval/RAG	GPU 动态装载 + 轮询执行	调用频率低，动态加载节省资源

映射机制建议：

统一配置 model_dispatch_map.json：

{
  "tinybert": "fpga",
  "fasttext": "fpga",
  "simcse": "gpu",
  "macbert": "gpu",
  "rag_retrieval": "gpu"
}

所有任务在进入 Dispatcher 阶段通过该映射表完成目标平台标定；
映射策略可热更新，支持 YAML/JSON 动态加载，无需重启服务。

7.3 动态模型卸载与资源回收机制设计

GPU 平台推荐部署 Eviction Manager 线程负责以下逻辑：

定期扫描 GPU 引擎池，判断模型空闲时间；
超过阈值（如 300s 无调用）后，释放 TensorRT 引擎并回收显存；
接收新任务请求时再重新加载（Cold start < 700ms）；

FPGA 平台因模型静态编译约束，不建议频繁切换，推荐：

编译多模型为同一 XMODEL（使用多 task entrypoint）；
或将静态模型以 shell 脚本切换部署到 DPU，结合 dpu_reset 热重载机制；
不同 DPU 上部署不同模型，统一由调度器控制分发路径。

八、实战案例：TinyBERT 与 MacBERT 的混合部署路径解析

8.1 项目背景与部署目标

某政务大厅在构建本地化智能问答系统时，提出以下部署目标：

问句处理延迟 ≤ 50ms；
系统不依赖公网，所有推理任务本地处理；
支持知识库检索（向量 Top-K 匹配）与语义分类功能；
整体系统功耗 ≤ 50W，设备尺寸限制为 2U；

根据需求，选定混合加速方案：

TinyBERT 用于用户意图分类 → 驻留 FPGA DPU（ZCU104）；
MacBERT 用于句向量生成 + TopK 检索 → 运行于 GPU（RTX A2000）；
控制器使用 Intel i7-12700 + Ubuntu 20.04，调度服务使用 Python + C++ 协程引擎；

8.2 系统结构图与模块划分（真实工程部署图）

                ┌────────────────────┐
                │   User Request     │
                └─────────┬──────────┘
                          ▼
                ┌────────────────────┐
                │   Dispatcher Core  │ ← 模型绑定、调度判定
                └──────┬────┬────────┘
                       ▼    ▼
          ┌────────────────┐ ┌────────────────┐
          │  FPGA DPU Unit │ │  GPU Engine     │
          │  ZCU104 + DPU  │ │  RTX A2000      │
          └────┬───────────┘ └───────┬─────────┘
               ▼                     ▼
        ┌────────────┐       ┌──────────────┐
        │ TinyBERT   │       │ MacBERT+ANN  │
        └────────────┘       └──────────────┘
               ▼                     ▼
           ┌───────────────┐   ┌──────────────┐
           │   Output Sync │ ← │   ResultPool │
           └───────────────┘   └──────────────┘

8.3 部署结果与指标汇总（实测）

项目项	指标结果
FPGA 推理延迟	平均 27.8ms（TinyBERT, 单句, 64 token）
GPU 推理延迟	平均 69.2ms（MacBERT, TopK 检索）
系统总延迟	平均 38.5ms（调度 + 推理 + 回写）
CPU 占用率	峰值 36.7%（调度引擎单核）
总功耗	平均 41.5W（整机）
并发支撑能力	单机最大支持并发 60 路问答链路
故障转移机制	FPGA 异常时自动转发至 GPU 模型处理路径

8.4 工程复盘与优化建议

TinyBERT 固化在 FPGA，性能与功耗完美满足要求；
MacBERT 经裁剪蒸馏后仍保留 97.6% 检索精度，FPGA 不适合部署；
同步调度中间件需支持 Redis 消息队列或 ZeroMQ，确保任务调度稳定；
模型绑定策略使用 JSON 可热更新机制，运维部署灵活性好；
日志打点建议加入 trace_id 与 pipeline_id，以便问题追踪与回溯。

九、工程总结

9.1 工程闭环能力评估

结合本系统的 FPGA × GPU 混合推理架构实战部署结果，形成如下真实、可量化的闭环能力分析：

能力维度	评估结果
部署可行性	已完成 ZCU104（FPGA）+ RTX A2000（GPU）的实机部署与模型绑定
调度稳定性	使用静态映射 + 异步协程调度器，平均调度延迟稳定在 1.2ms 以内
模型兼容性	成功运行 TinyBERT（INT8）、MacBERT（FP16）、SimCSE（FP16）等
功耗控制能力	峰值总功耗控制在 43W 左右，符合边缘机柜部署要求
故障恢复能力	支持 FPGA 异常自动转发至 GPU 处理，GPU 停机时任务将入等待队列
异构资源利用率	DPU 利用率平均 79%，GPU 利用率 60~75%，支持并发任务动态绑定
可维护性	所有模型注册、调度策略、执行路径可热更新，无需服务中断

该系统在实战中满足了多模型 + 多任务 + 多平台 + 高可用的异构推理能力构建要求，是面向国产大模型实际部署需求的高可控工程路径。

9.2 当前异构推理系统的现实边界

尽管系统已具备稳定运行能力，但在国产大模型持续扩展与多模态部署趋势下，仍存在以下边界问题：

边界问题	现状表现	工程制约
编译异构性	FPGA 编译流程与 GPU 引擎构建完全独立，工具链未统一	推理图无法统一调度/管理
在线调度难度高	多模型频繁热加载需保持执行路径一致性，运维复杂	无跨平台推理调度标准，需业务端感知执行平台
多模态模型支持弱	含图像分支模型如 CLIP 无法直接部署在 FPGA 上	非标准算子、分支结构无法映射 DPU
数据同步开销存在	中间特征跨平台同步需主控 CPU 中转，存在延迟瓶颈	共享内存机制未标准化，FPGA-GPU 通信间断
调度策略优化受限	当前多为静态映射，缺乏基于模型复杂度与系统状态的智能调度	无统一任务描述语言与跨平台任务仲裁模型

9.3 系统演进方向与可执行建议

在未来国产模型部署场景中，建议从以下五个方向推动混合推理系统的结构演进：

1）统一推理执行抽象接口（Unified Runtime API）

构建支持 DPU + TensorRT + ONNXRuntime 的统一 Runtime 包装；
使用 Adapter 模式屏蔽后端异构引擎差异，调度器可按策略动态绑定；
引入 TaskDescriptor 结构统一封装输入数据、目标模型、平台意图等；

2）调度智能化与资源状态感知

引入 ResourceStatusManager：实时记录 DPU/GPU 负载与排队状态；
调度器使用基于规则 + 队列策略的调度逻辑（如延迟优先、能耗优先）；
构建冷热模型调度优先级表与任务合并窗口控制（batch merging）；

3）增强 DPU 编译生态与多模型支持能力

使用 Vitis AI 3.x 支持的 multi-subgraph 构建多个模型共编译结构；
提供基于 Layer 编号的 Runtime 执行入口切换；
构建 TinyBERT + FastText + 多分类模型联合 XMODEL，提升部署密度；

4）引入 FPGA-GPU 间中间件同步机制

统一输入缓存为共享内存池（如 UVM / NUMA 结构）；
使用 ZMQ/Redis Channel 作为跨设备中间协调组件；
支持执行状态追踪、输出聚合、多平台回调收集路径标准化；

5）面向信创生态的可控国产部署工具链标准化

全流程使用国产开发环境构建调度、部署、编译工具（如鸿蒙、openEuler）；
引入龙芯、飞腾主控的 FPGA × GPU 工程适配包；
构建纯国产部署链：国产大模型（Qwen/TinyGLM）+ FPGA + ARM 主控 + 国密通信协议。

个人简介

作者简介：全栈研发，具备端到端系统落地能力，专注人工智能领域。
个人主页：观熵
个人邮箱：[email protected]
座右铭：愿科技之光，不止照亮智能，也照亮人心！

专栏导航

观熵系列专栏导航：
AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到AI在行业中的落地应用，我们将深入剖析最前沿的AI技术，分享实用的开发经验，并探讨AI未来的发展趋势
AI开源框架实战：面向 AI 工程师的大模型框架实战指南，覆盖训练、推理、部署与评估的全链路最佳实践
计算机视觉：聚焦计算机视觉前沿技术，涵盖图像识别、目标检测、自动驾驶、医疗影像等领域的最新进展和应用案例
国产大模型部署实战：持续更新的国产开源大模型部署实战教程，覆盖从模型选型 → 环境配置 → 本地推理 → API封装 → 高性能部署 → 多模型管理的完整全流程
Agentic AI架构实战全流程：一站式掌握 Agentic AI 架构构建核心路径：从协议到调度，从推理到执行，完整复刻企业级多智能体系统落地方案！
云原生应用托管与大模型融合实战指南
智能数据挖掘工程实践
Kubernetes × AI工程实战
TensorFlow 全栈实战：从建模到部署：覆盖模型构建、训练优化、跨平台部署与工程交付，帮助开发者掌握从原型到上线的完整 AI 开发流程
PyTorch 全栈实战专栏： PyTorch 框架的全栈实战应用，涵盖从模型训练、优化、部署到维护的完整流程
深入理解 TensorRT：深入解析 TensorRT 的核心机制与部署实践，助力构建高性能 AI 推理系统
Megatron-LM 实战笔记：聚焦于 Megatron-LM 框架的实战应用，涵盖从预训练、微调到部署的全流程
AI Agent：系统学习并亲手构建一个完整的 AI Agent 系统，从基础理论、算法实战、框架应用，到私有部署、多端集成
DeepSeek 实战与解析：聚焦 DeepSeek 系列模型原理解析与实战应用，涵盖部署、推理、微调与多场景集成，助你高效上手国产大模型
端侧大模型：聚焦大模型在移动设备上的部署与优化，探索端侧智能的实现路径
行业大模型 · 数据全流程指南：大模型预训练数据的设计、采集、清洗与合规治理，聚焦行业场景，从需求定义到数据闭环，帮助您构建专属的智能数据基座
机器人研发全栈进阶指南：从ROS到AI智能控制：机器人系统架构、感知建图、路径规划、控制系统、AI智能决策、系统集成等核心能力模块
人工智能下的网络安全：通过实战案例和系统化方法，帮助开发者和安全工程师识别风险、构建防御机制，确保 AI 系统的稳定与安全
智能 DevOps 工厂：AI 驱动的持续交付实践：构建以 AI 为核心的智能 DevOps 平台，涵盖从 CI/CD 流水线、AIOps、MLOps 到 DevSecOps 的全流程实践。
C++学习笔记？：聚焦于现代 C++ 编程的核心概念与实践，涵盖 STL 源码剖析、内存管理、模板元编程等关键技术
AI × Quant 系统化落地实战：从数据、策略到实盘，打造全栈智能量化交易系统
大模型运营专家的Prompt修炼之路：本专栏聚焦开发 / 测试人员的实际转型路径，基于 OpenAI、DeepSeek、抖音等真实资料，拆解从入门到专业落地的关键主题，涵盖 Prompt 编写范式、结构输出控制、模型行为评估、系统接入与 DevOps 管理。每一篇都不讲概念空话，只做实战经验沉淀，让你一步步成为真正的模型运营专家。

如果本文对你有帮助，欢迎三连支持！

点个赞，给我一些反馈动力
⭐ 收藏起来，方便之后复习查阅
关注我，后续还有更多实战内容持续更新

你可能感兴趣的:(大模型高阶优化技术专题,fpga开发,系统架构,人工智能)

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
EasyPlayer播放器系列开发计划2025 xiejiashu EasyPlayer EasyPlayer EasyPlayer播放器 RTSP播放器 js播放器 Web播放器
EasyPlayer系列产品发展至今，已经超过10年，从最早的EasyPlayerRTSP播放器，到如今维护的3条线：EasyPlayer-RTSP播放器：Windows、Android、iOS；EasyPlayerPro播放器：Windows、Android、iOS；EasyPlayer.js播放器：H5；这3个播放器各有各的应用场景，用户量也是巨大，像RTSP版本的播放器，到今天依然还有很多低
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
猎板 PCB 控深槽工艺：5G 基站散热模块的关键支撑猎板PCB黄浩 5G 运维数据库
PCB控深槽工艺在5G基站散热模块中的关键作用：猎板PCB的技术突破在5G基站的密集高频信号与高功率运行环境下，散热性能直接决定了设备的稳定性和寿命。猎板PCB通过创新性的控深槽工艺（控深锣/控深铣），结合材料科学与结构优化，为5G基站散热模块提供了高精度、高可靠性的解决方案，有效攻克了高热负荷下的技术瓶颈。一、5G基站散热的核心挑战热负荷激增：5G基站的射频功放（PA）、电源管理模块等器件功耗显
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
旧系统UI焕新陷阱：保留业务习惯与引入新交互的平衡点把控贝格前端工场 ui 交互
摘要**想给老旧系统换上“高颜值新衣”，却遭遇员工集体吐槽“不会用”？满心期待新交互能提升效率，结果用户操作频频出错，业务进度反而被拖慢？旧系统UI焕新本是优化体验的好机会，可在保留多年养成的业务操作习惯，与引入更先进便捷的新交互方式之间，却横亘着巨大鸿沟。稍有不慎，就会陷入“改了不如不改”的尴尬境地。这场关于“守旧”与“创新”的博弈，究竟该如何破局？一、旧系统UI焕新：一场甜蜜又棘手的改造工程旧
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户