观熵

基于国产手机 SoC 的多模态模型推理加速实战：GPU × NPU 协同优化全流程解析

关键词

多模态模型推理、NPU 硬件加速、GPU 并行计算、国产手机 SoC、端侧部署优化、华为昇腾 NPU、小米 Surge 芯片、高通 AI Engine、异构计算加速、TFLite NNAPI、ONNX Runtime EP

摘要

随着国产智能手机 SoC（如华为昇腾、vivo V系列、小米 Surge、紫光展锐、联发科 Dimensity）的异构计算能力不断增强，开发者已可在移动端高效部署视觉、语音、传感器等多模态融合模型。本文以工程实践为核心，从模型压缩转换、NNAPI 接入、GPU/NPU 加速策略设计，到实际落地评估，系统剖析如何在国产终端上实现多模态模型的高效推理。通过实测对比不同硬件平台下的性能表现，结合主流框架（TFLite、ONNX Runtime、MNN、MindSpore Lite），给出具备可落地能力的完整优化路径，助力构建响应更快、功耗更低的多模态 AI 应用。

芯片平台	AI 加速单元	支持模型类型	框架兼容性
华为麒麟 990/9000	Ascend Lite NPU	CNN / Transformer	MindSpore Lite / TFLite
小米 Surge G1/X1	NPU + DSP	CV / NLP	NNAPI / TFLite
联发科 Dimensity 9200	APU 690（三核架构）	多模态混合任务	NNAPI / ONNX Runtime EP
紫光展锐 T820	NPU + ISP联动	视觉+感知融合模型	TFLite / MNN
荣耀 Magic5 Pro	自研 AI Boost NPU	CV / Sensor Fusion	NNAPI / TFLite

这些 SoC 的 NPU 通常支持 INT8、FP16、BF16 精度，对模型结构提出如下要求：

模型必须转换为符合 NNAPI / LiteRuntime 的结构（如多输入单输出、可解析子图）；
模态间数据依赖必须清晰划分，避免图结构中存在控制流节点；
模型精度需匹配硬件支持的数据格式（推荐量化为 INT8）；

不同厂商的 NPU 架构也存在一定异构性，例如：

华为昇腾类 NPU 更适合推理 Transformer + 全连接模块；
联发科 APU 在图像、语音前处理卷积计算上吞吐率更高；
小米 Surge G1 对多分支结构、动态输入兼容度更强；

因此在进行部署前必须明确目标设备芯片型号与其 AI SDK 能力，以指导后续的模型拆分与路径选择。

GPU vs NPU 架构设计与计算类型差异

GPU 与 NPU 是 Android 移动端当前主要的模型推理加速单元，其在体系结构与计算调度上有显著差异：

对比项	GPU（如 Adreno/Mali）	NPU（如 Ascend Lite / APU）
计算类型	通用矩阵计算、图像卷积并行	专用深度学习算子（Conv/MM）
编程模型	OpenCL / Vulkan	专用图编译（TFLite Delegate / NNAPI）
模型精度	FP16/FP32（部分 INT8 支持）	优先支持 INT8、部分支持 FP16
并发调度	与图形任务共享，调度不稳定	专用推理引擎，调度可控
性能特性	适合大模型高吞吐推理	适合轻量模型低延迟推理

多模态任务中建议采用“分模态异构部署”策略：

图像模态：使用 NPU 卷积加速（高带宽）；
语音模态：若需 RNN/Attention，可落在 GPU 或 CPU；
传感器模态：计算量小，CPU 可处理；

示例架构设计：

图像 → NPU + FP16 卷积子图
音频 + IMU → GPU + ONNX Runtime（带注意力）
融合层 + 分类 → CPU or GPU fallback

通过上述结构可最大限度发挥硬件加速资源，避免单一设备瓶颈导致全链路推理失衡。

第2章：多模态模型推理计算特征分析

多模态融合模型的典型结构剖析

典型的多模态推理模型一般由以下模块组成：

模态专属编码器（Encoder）：
- 图像：CNN（MobileNet、EfficientNet-lite）输出 [1×512]；
- 语音：MFCC + LSTM or Conv1D 输出 [1×384]；
- IMU：Conv1D/MLP + Flatten 输出 [1×64]；
模态融合层（Fusion Layer）：
- Concatenation / Cross-Attention / Multi-Modal Transformer；
- 输出统一语义向量 [1×D]；
任务分类器或回归头（MLP Head）：
- 2~3 层 MLP 输出行为标签 / 语义类别 / 状态值；

以下是融合结构的通用形式：

[Image_Feature] →  
                  \ 
[Audio_Feature] →   → [Fusion Layer] → [MLP Head]
                  /
[IMU_Feature]   →

计算量分析（以 Batch=1 为例）：

图像 Encoder 占总 FLOPs 的 60%~70%；
音频 / IMU Encoder 占比 10%~20%；
Fusion + MLP 约占 10%；

因此，优化重点应放在图像模型压缩与卷积加速路径，同时注意融合模块是否可被量化支持（如 Attention、Residual 等结构是否标准）。

特征提取与融合阶段计算类型与资源占用分布

模块类型	计算密集度	可加速性	推荐部署位置
Conv2D	高	✅（NPU优）	NPU / GPU
DepthwiseConv	中	✅	NPU / GPU
LSTM/GRU	高	❌（低兼容）	GPU / CPU
Transformer	中-高	部分 ✅	GPU / CPU
MLP / FC	中	✅（若结构标准）	GPU / CPU / NPU
Attention Layer	高	❌（需结构重构）	GPU / CPU

建议策略：

对于卷积密集模型（如图像主导的多模态模型），使用 NNAPI 或 Huawei Ascend Delegate 优化；
对于融合模型（如 Multi-Modal Transformer），推荐简化结构或分模块部署；
若使用 TFLite 模型，需通过 tflite_support.metadata 构建清晰的多输入绑定结构，支持多模态输入流对接；

第3章：推理框架选型与国产平台兼容性策略

TensorFlow Lite × NNAPI Delegate 加速路径实战

TensorFlow Lite（TFLite）是当前主流 Android 平台部署 AI 模型的首选推理引擎，具备良好的量化支持与较低推理延迟。对于国产手机 SoC 的适配，则需借助 Google 提供的 NNAPI Delegate 机制，将推理任务分发至底层 NPU 执行。

接入步骤如下：

模型转换：将原始 TensorFlow 模型转换为 .tflite 格式，并支持 INT8 或 FP16 量化：

converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
tflite_model = converter.convert()

启用 NNAPI 加速：

在 Android 端使用如下方式构建 Interpreter：

val options = Interpreter.Options().apply {
    setUseNNAPI(true)
}
val interpreter = Interpreter(loadModelFile(), options)

验证是否启用成功：

通过 adb shell dumpsys nnapi 查看是否存在硬件后端调用记录，也可使用 Profiling 工具如 Systrace 检查调用栈。
平台差异调优策略：
- 小米、荣耀等国产设备已支持 NNAPI v1.3+，具备基本的卷积、GEMM、ReLU、Softmax 加速能力；
- 对于部分结构（如 Attention、LSTM），NNAPI 无法覆盖，将自动 fallback 到 CPU；

注意事项：

不建议使用多输入多输出的动态模型结构；
推荐提前对模型子图做静态分析与剪裁，避免 NNAPI Delegate 拆分失败；
多模态输入模型需通过 tflite_support.metadata 工具设置签名，便于 Android 接入。

ONNX Runtime × EP 后端适配方式

ONNX Runtime 提供更灵活的部署能力，支持通过 Execution Provider (EP) 将不同子图映射至对应计算单元，适用于需要精细控制多模态模型推理路径的项目。

国产平台的可行 EP 接入策略：

EP 名称	支持芯片平台	特点
NNAPI EP	所有支持 Android 10+ 的设备	原生接入 Android NNAPI
Huawei Ascend EP	麒麟系列 + 昇腾 NPU	专用推理指令，性能优异
MediaTek APU EP	天玑系列	与 NNAPI 共用，需定制 SDK
CPU EP	所有平台	兼容兜底，支持全部算子

ONNX 模型接入流程：

模型优化：

python -m onnxruntime.tools.optimizer_cli \
  --input model.onnx \
  --output model_optimized.onnx \
  --model_type bert \
  --optimization_level 99

EP 配置与加载：

OrtEnvironment env = OrtEnvironment.getEnvironment();
OrtSession.SessionOptions opts = new SessionOptions();
opts.addNnapi();
OrtSession session = env.createSession(modelPath, opts);

多模态输入处理（以图像 + 音频为例）：

Map<String, OnnxTensor> inputs = new HashMap<>();
inputs.put("input_image", imageTensor);
inputs.put("input_audio", audioTensor);

优势：

更清晰的子图拆解能力；
支持动态 shape 与异步加载；
可以通过自定义 EP 实现模型精细化调度策略；

实际项目建议：若模型结构较为复杂（如 Transformer 融合结构），建议使用 ONNX Runtime + NNAPI EP 组合，避免 Delegate 使用受限造成 fallback 频繁切换。

第4章：模型量化与结构压缩优化路径

为提升多模态模型在国产手机终端的执行效率，模型量化与结构压缩是部署前不可或缺的关键步骤，直接决定推理速度与兼容性。

多模态模型中各子网络的量化策略

不同模态子网络在计算模式与张量分布上存在显著差异，需采用差异化量化策略：

模态	建议量化方式	工具链路径
图像 (CNN)	INT8 静态量化	TFLite: PostTrainingQuant / QAT
音频 (Conv1D/LSTM)	FP16 动态量化	ONNX: `--use_external_data_format`
IMU (MLP)	INT8 权重 + 激活量化	MindSpore Lite / MNN 支持全量化
Fusion Layer (Attention/Concat)	不建议量化 / 混合精度	Transformer 结构中易精度退化

推荐使用 感知量化（PTQ）+ QAT（训练后量化 + 微调） 联合策略：

converter = tf.lite.TFLiteConverter.from_saved_model(model_path)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
converter.representative_dataset = rep_dataset_gen
quant_model = converter.convert()

Transformer 模块中的 INT8 加速实践路径

Transformer 是多模态融合中常见结构，其多层 MultiHeadAttention、LayerNorm、GEMM 运算在移动端成本较高。

优化路径：

替换为轻量化 Transformer 结构，如 MobileViT、LiteFormer；
使用 TensorFlow Model Optimization Toolkit (TFMOT) 进行全结构 INT8 训练；
对残差连接与 LayerNorm 做结构重排（建议替换为 ReLU + Conv1D + Skip）；
推理时使用 XNNPACK Delegate（TFLite）或 INT8 EP（ONNX）；

ONNX 示例：

python onnxruntime_tools.quantization.quantize_dynamic \
  --model_input model.onnx \
  --model_output model.int8.onnx \
  --per_channel

模型压缩与子图拆分建议

若整模型过大或模态耦合严重，可使用以下方式进行压缩：

模态拆分：图像、语音、传感器三个子模型独立部署；
特征压缩：将 [1×512] 映射为 [1×128]，使用 PCA 或 1×1 Conv 实现；
权重量化：如 MobileNet 权重由 16MB 压缩至 3.4MB；

最终部署时，结合异构硬件可实现：

[Image Model - NPU]   +   [Audio Model - GPU]   +   [IMU Model - CPU]
           ↓                      ↓                      ↓
                        [Fusion - CPU/GPU] → Output

第5章：NPU 推理部署实战：以小米、荣耀为例

国产终端厂商（如小米、荣耀、vivo 等）近年来大幅加强了其自研芯片的 NPU 算力能力。对于多模态模型，如何将各子网络有效映射到 NPU 并控制数据流转，是实现低延迟、高吞吐的核心。本章以小米和荣耀平台为例，讲解多模态模型在实际终端上部署至 NPU 的完整流程。

小米平台（Surge G1 + MTK APU）部署流程

小米 HyperOS 生态下，搭载 Surge G1/X1 及天玑 9200/9300 平台，底层采用 MediaTek NeuroPilot + NNAPI 实现 NPU 推理，开发者可使用 TFLite + NNAPI 接入。

步骤如下：

模型转换与量化（图像子模型为主）：

converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
converter.representative_dataset = rep_dataset
tflite_model = converter.convert()

模型签名构建（多输入）：

使用 tflite_support.metadata 设置图像/音频/IMU 三路输入：
```
metadata_writer = MetadataWriter.create_for_inference(...)
metadata_writer.populate()
```

在 Android 应用中开启 NNAPI Delegate：

val interpreter = Interpreter(modelBuffer, Interpreter.Options().apply {
    setUseNNAPI(true)
})

推理验证：
- 通过 adb shell dumpsys nnapi 验证是否进入 NPU 执行；
- 实测在 Redmi K60 Pro 上，多模态模型推理耗时从 89ms 降至 21ms；

注意点：

建议图像模型单独拆分，IMU 与 Audio 子模型可合并后 fallback 至 GPU；
HyperOS 13 起支持更多 INT8 自定义算子，建议对融合部分重新训练量化版本；

荣耀平台（自研 NPU）部署路径

荣耀 MagicOS 平台通常搭载自研 NPU 方案（如 AI Boost NPU），推理接入方式类似于标准 NNAPI，但需注意其内部对部分算子类型的覆盖限制。

部署方式：

转换为 TFLite 格式，并确认模型结构符合标准静态图限制；
启用 setUseNNAPI(true) 后进行动态 Delegate 分配；
使用 adb shell am start -n com.android.nn.benchmark/.NNBenchmarkApp 验证 NPU 吞吐能力；

部署多模态模型推荐结构：

图像子模型 → NPU
音频 + IMU 模型 → CPU or GPU
融合 MLP 层 → CPU fallback

实测结果（Magic5 Pro）：

模型阶段	CPU 单独	NPU 加速后
图像编码	55ms	12.8ms
音频特征提取	23ms	CPU保留
融合推理	17ms	6.3ms
总耗时	95ms	28.9ms

荣耀平台建议通过模型裁剪 + 模态解耦优化整体结构，提升 NPU 调度效率。

第6章：GPU 并行优化策略与 Fallback 路径设计

虽然 NPU 能力不断增强，但在部分场景下，因模型结构不兼容或芯片功耗管理限制，GPU 依然是稳定可靠的加速单元，尤其适合运行音频、传感器等轻量子模型或未量化结构。

GPU 并行推理结构与部署建议

推荐的并行结构如下：

图像 → NPU
音频 + IMU → GPU
融合层 → GPU/CPU fallback

使用 TFLite 配置 GPU Delegate：

val gpuDelegate = GpuDelegate()
val options = Interpreter.Options().addDelegate(gpuDelegate)
val interpreter = Interpreter(modelBuffer, options)

对于 ONNX Runtime：

val opts = OrtSession.SessionOptions().apply {
    addOrtGpu()
}
val session = env.createSession(modelPath, opts)

注意事项：

GPU Delegate 支持 FP16 / FP32，不支持 INT8；
特别适合包含较多 Conv1D, GEMM, Reshape 的模块；
需确保模型结构中无动态 shape 或自定义 op；

推理路径自动回退策略（Fallback Design）

由于推理中部分情况无法进入硬件加速（如 Tensor 未对齐、算子不支持），必须构建完整的回退机制：

NNAPI Fallback 至 CPU：

使用 TFLite 自动判断 Delegate 加载失败时切换：

try {
    options.setUseNNAPI(true)
    val interpreter = Interpreter(modelBuffer, options)
} catch (e: Exception) {
    options.setUseNNAPI(false)
    val interpreter = Interpreter(modelBuffer, options)
}

ONNX Runtime 动态切换 EP：

通过 SessionOption 顺序优先级设置 fallback 方案：

sessionOptions.appendExecutionProvider("NNAPI")
sessionOptions.appendExecutionProvider("CPUExecutionProvider")

融合推理控制器设计：

自定义模块控制每个模态路径：

val useNPU = isNPUAvailable && supportsINT8(model)
val imageResult = if (useNPU) runNPUModel(imageInput) else runCPUModel(imageInput)

此机制能显著提升模型稳定性，在不同机型、不同芯片下保持推理结果一致，确保推理系统鲁棒性。

在多模态实际部署过程中，GPU 常作为中型计算任务（非卷积密集）调度单元，通过协同管理 GPU/NPU 资源，构建高吞吐、低延迟的混合推理链路，是目前国产终端推理架构优化的核心方向之一。

第7章：多模态推理链路性能基准测试与瓶颈分析

在构建并部署基于 NPU/GPU 的多模态推理系统之后，对其性能表现进行全面的链路测试和瓶颈识别，是保障产品上线稳定性与交互体验的关键步骤。本章聚焦多模态模型在国产移动端执行过程中的关键性能指标构成、测试方法与性能优化建议。

推理耗时构成分析：从数据预处理到结果输出

以典型图像 + 音频 + IMU 模型为例，其在 Android 平台执行链路包括如下阶段：

阶段	操作内容	平均耗时占比（CPU基准）
数据预处理	图像 resize/normalize，音频帧 FFT	15%
特征提取	各模态子模型推理	60%
模态融合	Transformer / Attention 层融合	10%
后处理	分类/回归头推理 + 输出解码	5%
内存拷贝与调度	模态间张量传递，delegate 切换等	10%

从实测角度看，图像子模型推理通常是主要瓶颈，在 CPU 上执行常超过 60ms，部署 NPU 后可降至 10~15ms；而模态间张量对齐、数据类型转换等开销往往被低估，尤其是在使用 ONNX Runtime 时，EP 切换带来的 tensor 复制非常显著。

并行与串行执行策略对比分析

部署多模态模型时，常面临以下执行路径设计决策：

模态子模型是否串行推理，还是并行异步调度？
模态结果是否需同步对齐后再进入融合层？
资源争抢是否影响某一模态的执行延迟？

实测对比（Redmi K60 Pro，图像+音频模态）：

执行方式	总耗时（ms）	图像耗时	音频耗时	Fusion耗时
串行执行	84.1	58.3	18.7	7.1
并行执行	61.5	58.5	18.5	7.1

关键结论：

模态独立结构应优先异步执行，提升并行度；
NPU/GPU 若共享 Bus 通道，需避免在高峰时段同时调度大张量；
可引入模态输出队列机制（如 ConcurrentLinkedQueue）保障异步性；

热功耗管理机制对推理稳定性的影响

多数国产手机采用动态电源管理（DVFS）控制芯片频率与功耗。在长时间运行 AI 推理任务（如持续 10fps 实时识别）时，芯片将逐步降频，直接影响 NPU/GPU 推理稳定性。

实际案例：

vivo X90，APU 初始推理帧率 15fps，5分钟后降为 9fps；
荣耀 Magic5 Pro，NPU 推理功耗稳定在 1.8W，芯片降频后推理耗时从 28ms 升至 49ms；

建议：

为关键任务引入 ThermalManager 控制窗口推理频率；
大模型分段推理，通过 predictNext 拆分减少连续推理时间；
构建“预热 - 运行 - 冷却”节奏调度器，保障功耗与性能平衡；

第8章：异构计算资源的协同调度机制设计

为了充分利用国产手机 SoC 上的多种 AI 计算单元（如 GPU、NPU、DSP、CPU），必须在系统层或应用层构建有效的资源调度机制，实现任务优先级、任务类型与硬件能力三者间的高效匹配。

感知任务与计算资源映射模型构建

为实现调度决策的自动化，可建立如下形式的任务 × 资源能力映射表：

模态任务	优先资源	次选资源	原因说明
图像卷积编码器	NPU	GPU	高吞吐卷积任务，NPU效率更高
音频 + IMU特征提取	GPU	CPU	运算模式偏向 GEMM，适合 OpenCL 执行
模态融合 MLP	CPU	GPU	参数较少，不值得调度至异构设备
Transformer Block	GPU	CPU	多层矩阵乘，需较高并行度

调度策略设计核心逻辑：

if (isNpuAvailable() && taskType == "conv-heavy") {
    scheduleToNPU()
} else if (isGpuAvailable() && taskType == "matrix-mul") {
    scheduleToGPU()
} else {
    scheduleToCPU()
}

动态资源感知调度控制器实现思路

开发者可封装统一调度控制类 ComputeOrchestrator，其核心职责：

资源能力初始化检测：识别当前设备是否支持 NNAPI、GPU delegate、Ascend EP；
当前功耗状态评估：通过 PowerProfile / ThermalService 判断是否处于降频状态；
模型结构分析与任务拆解：按模块粒度进行任务标签标注；
推理路径选择与热备策略定义：预设 primary 和 fallback 路径，并允许动态切换。

简化代码结构示例：

class ComputeOrchestrator {
    fun schedule(task: AIComputeTask): ComputeDevice {
        return when {
            task.prefersNPU && NPU.isAvailable() -> NPU
            task.prefersGPU && GPU.isAvailable() -> GPU
            else -> CPU
        }
    }
}

在系统设计中，应将该调度控制器与模型加载器、数据预处理模块解耦，确保推理任务调用链的灵活性与可扩展性。

最终调度策略建议支持以下功能：

每模态独立调度策略配置；
动态帧率控制与功耗状态联动；
设备异常或性能下降时支持无感 fallback；

构建协同调度机制的目标并非单纯“最强硬件优先”，而是在 功耗、性能、兼容性、稳定性 多维之间构建最优平衡。国产端测异构计算资源的系统性调度能力，将成为未来多模态模型规模化部署的关键能力基础。

第9章：典型应用实战案例解析

在多模态推理模型的移动端部署实践中，不同业务场景对模型结构、计算资源调度、延迟与精度等维度存在差异化要求。本章基于真实平台落地案例，分别从语音+图像联合识别、图像+IMU行为检测、小米多模态助手三个方向，解析端侧部署的完整闭环。

案例一：语音+图像联合识别在 vivo 平台的部署实践

项目目标：开发一款多模态语音搜索识图应用，用户可通过“描述+图像”输入获取商品信息。

模型结构：

图像模态：EfficientNet-lite + 全连接，输出 256-d 向量；
语音模态：AudioConv + Transformer Encoder，输出 128-d 向量；
融合层：Cross-Attention；
输出层：商品分类器，共覆盖 4.8 万商品 SKU。

部署路径：

图像子模型量化为 INT8，采用 NNAPI Delegate 执行（MTK APU）。
语音子模型部署至 GPU，TensorFlow Lite + GpuDelegate 加载。
融合及 MLP 分类层由 CPU 处理，考虑精度与功耗。

性能评估（vivo X90 Pro）：

模块	CPU 基准	NPU/GPU 加速	加速率
图像推理	64.3 ms	13.5 ms	4.7x
语音推理	32.1 ms	14.8 ms	2.1x
模态融合 + MLP	11.2 ms	9.4 ms	1.2x
总推理耗时	107.6 ms	37.7 ms	2.85x

部署优化建议：

使用端侧缓存机制，在多帧图像输入时缓存图像模态输出；
对 Cross-Attention 部分重写为硬件友好的矩阵操作，进一步压缩 Fusion 时延。

案例二：图像+IMU联合行为识别模型在荣耀平台落地实践

项目目标：实现端侧 AI 健康监测功能，结合摄像头与传感器识别老人是否跌倒、异常移动等行为。

模型结构：

图像模态：YOLOv5s → Pose Estimation；
IMU模态：6轴数据输入 → Conv1D + LSTM；
融合层：时序注意力机制；
输出：动作类别（站立、坐下、跌倒、异常站立等）。

部署策略（荣耀 Magic5 Pro）：

图像推理使用华为 Ascend Lite NPU + TFLite NNAPI 加速；
IMU 处理模块部署于 CPU，并做序列压缩（128→32 steps）；
模态融合结构简化，使用注意力替换 Bi-LSTM 合并结构；
推理主控线程采用 C++ native 接入，避免 Java 层 GC 干扰。

性能对比：

模块	CPU 耗时	混合加速耗时	加速效果
图像模块	98.4 ms	24.5 ms	4.01x
IMU 模块	8.7 ms	5.3 ms	1.64x
融合与输出推理	11.2 ms	7.9 ms	1.41x
整体推理时延	118.3 ms	37.7 ms	3.14x

部署优化建议：

使用 SensorEventListener 提前拉取 IMU 数据，配合滑窗队列避免线程堵塞；
融合部分建议使用矩阵分块方式（如 Block Attention）进一步降低计算量。

第10章：未来展望与国产 AI 芯片生态建议

多模态模型在端侧部署的成功依赖于两方面能力：模型本身的轻量化设计与 SoC 提供的异构推理能力。随着国产手机 AI 芯片的持续演进，其生态体系建设将直接影响多模态技术在实际场景中的规模化落地能力。

多模态模型对 NPU 架构提出的新挑战

当前多数 NPU 推理引擎仍面向传统 CNN 模型优化，在面对以下结构时表现不佳：

Transformer 和 Cross-Attention；
多输入动态 shape 模型；
模态融合结构中存在条件控制流逻辑；

国产 SoC 未来应重点突破如下方向：

支持静态图中的模态拆分与异步调度；
引入图调度指令，支持跨模态依赖建模；
NPU 执行引擎提供多流并发接口，便于图像/语音并行执行；

此外，应进一步打通模型编译 → 加速策略生成 → 运行时调度链路，构建“编译-调度-推理”一体化平台。

建议终端厂商开放更多低层推理 API 与调度接口

目前大多数终端厂商仅暴露 NNAPI 或部分私有 SDK，建议逐步开放：

推理图结构分析接口（如节点耗时 / 激活张量尺寸）；
NPU 编译器中间表示（如 Ascend IR / MediaTek Binary Graph）；
异构调度策略配置接口（GPU vs NPU 路径权重）；
芯片功耗与温度反馈 API（推理负载感知）；

对于开发者而言，透明度高的硬件调度接口将极大提升模型部署效率与工程调试能力。

构建“模型开发 → 编译 → 调度 → 分发”的闭环平台设想

参考 PC 云端的 AI 工程链路，端测 AI 未来也应构建如下平台闭环：

模型开发：支持多模态结构设计与模块级训练；
编译与适配：支持 TFLite / ONNX / MindSpore Lite 等路径；
调度决策：依据模态结构与硬件能力，动态生成调度图；
分发执行：将模型拆解为多个子图，按需运行于 GPU/NPU/CPU；
反馈优化：推理结果与系统指标回流，用于下一轮模型精化。

国产 AI 芯片生态需构建统一规范与工具链，推动“模型开发 × 芯片执行”真正协同闭环，才能使多模态 AI 在边缘终端的落地从“工程挑战”迈入“产品默认选项”阶段。

个人简介

作者简介：全栈研发，具备端到端系统落地能力，专注人工智能领域。
个人主页：观熵
个人邮箱：[email protected]
座右铭：愿科技之光，不止照亮智能，也照亮人心！

专栏导航

观熵系列专栏导航：
AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到AI在行业中的落地应用，我们将深入剖析最前沿的AI技术，分享实用的开发经验，并探讨AI未来的发展趋势
AI开源框架实战：面向 AI 工程师的大模型框架实战指南，覆盖训练、推理、部署与评估的全链路最佳实践
计算机视觉：聚焦计算机视觉前沿技术，涵盖图像识别、目标检测、自动驾驶、医疗影像等领域的最新进展和应用案例
国产大模型部署实战：持续更新的国产开源大模型部署实战教程，覆盖从模型选型 → 环境配置 → 本地推理 → API封装 → 高性能部署 → 多模型管理的完整全流程
Agentic AI架构实战全流程：一站式掌握 Agentic AI 架构构建核心路径：从协议到调度，从推理到执行，完整复刻企业级多智能体系统落地方案！
云原生应用托管与大模型融合实战指南
智能数据挖掘工程实践
Kubernetes × AI工程实战
TensorFlow 全栈实战：从建模到部署：覆盖模型构建、训练优化、跨平台部署与工程交付，帮助开发者掌握从原型到上线的完整 AI 开发流程
PyTorch 全栈实战专栏： PyTorch 框架的全栈实战应用，涵盖从模型训练、优化、部署到维护的完整流程
深入理解 TensorRT：深入解析 TensorRT 的核心机制与部署实践，助力构建高性能 AI 推理系统
Megatron-LM 实战笔记：聚焦于 Megatron-LM 框架的实战应用，涵盖从预训练、微调到部署的全流程
AI Agent：系统学习并亲手构建一个完整的 AI Agent 系统，从基础理论、算法实战、框架应用，到私有部署、多端集成
DeepSeek 实战与解析：聚焦 DeepSeek 系列模型原理解析与实战应用，涵盖部署、推理、微调与多场景集成，助你高效上手国产大模型
端侧大模型：聚焦大模型在移动设备上的部署与优化，探索端侧智能的实现路径
行业大模型 · 数据全流程指南：大模型预训练数据的设计、采集、清洗与合规治理，聚焦行业场景，从需求定义到数据闭环，帮助您构建专属的智能数据基座
机器人研发全栈进阶指南：从ROS到AI智能控制：机器人系统架构、感知建图、路径规划、控制系统、AI智能决策、系统集成等核心能力模块
人工智能下的网络安全：通过实战案例和系统化方法，帮助开发者和安全工程师识别风险、构建防御机制，确保 AI 系统的稳定与安全
智能 DevOps 工厂：AI 驱动的持续交付实践：构建以 AI 为核心的智能 DevOps 平台，涵盖从 CI/CD 流水线、AIOps、MLOps 到 DevSecOps 的全流程实践。
C++学习笔记？：聚焦于现代 C++ 编程的核心概念与实践，涵盖 STL 源码剖析、内存管理、模板元编程等关键技术
AI × Quant 系统化落地实战：从数据、策略到实盘，打造全栈智能量化交易系统
大模型运营专家的Prompt修炼之路：本专栏聚焦开发 / 测试人员的实际转型路径，基于 OpenAI、DeepSeek、抖音等真实资料，拆解从入门到专业落地的关键主题，涵盖 Prompt 编写范式、结构输出控制、模型行为评估、系统接入与 DevOps 管理。每一篇都不讲概念空话，只做实战经验沉淀，让你一步步成为真正的模型运营专家。

如果本文对你有帮助，欢迎三连支持！

点个赞，给我一些反馈动力
⭐ 收藏起来，方便之后复习查阅
关注我，后续还有更多实战内容持续更新

你可能感兴趣的:(智能终端Ai探索与创新实践,人工智能,android,NPU,GPU)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
别再讲道理啦，对方听不进去的方所
我之前写过一篇叫做《你总妄想改变他人》，然后就有朋友跟我说，有一些方法可以改变他人之类的。嗯，是这样，但是任何具体的问题，都要限定好语境，描述清楚前提条件，然后再表达观点，我的这位朋友的说法就犯了一刀切的错误，这样并不能让讨论正常展开（这篇我得先给她看看，不然可能会挨揍）。好了，hhhh，谁让她不能写文章呢，我就来再说一说吧。我前面说过，我们在学到一个道理、学会一种方法之后，总是迫不及待地想要去与
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
关于流媒体播放器EasyPlayer和EasyPlayerPro的介绍以及其区别 EasyDarwin EasyDarwin 音视频 ffmpeg 人工智能大数据 ar
EasyPlayer是一款流媒体播放器系列项目，它支持多种流媒体协议的播放，包括但不限于RTSP、RTMP、HTTP、HLS、UDP、RTP、File等。除此之外，EasyPlayer还支持本地文件播放和多种功能特性，包括本地抓拍、本地录像、播放旋转、多屏播放、倍数播放等。EasyPlayer核心基于ffmpeg，稳定、高效、可靠、可控。随着多年的不断发展和迭代，EasyPlayer基于成功的实践
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
氧惠官方邀请码333777，氧惠邀请码怎么获得？氧惠邀请码有什么套路？知行导师
问：氧惠邀请码怎么获得？答：氧惠官方邀请码333777返点高佣金高真的高。问：氧惠邀请码有什么套路？答：氧惠官方邀请码333777返点高佣金高真的高。氧惠APP汇聚各大主流电商和生活服务平台优惠，展示全网全品类商品，满足网购爱好者对品质好货与极致性价比的追求，并同时享受大平台购物权益保障。满足用户日常吃喝玩乐衣食住行的聚合APP，独特的商业模式，响应国家号召，为实现全民共富而努力奋斗。氧惠邀请码3
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
EasyPlayer播放器系列开发计划2025 xiejiashu EasyPlayer EasyPlayer EasyPlayer播放器 RTSP播放器 js播放器 Web播放器
EasyPlayer系列产品发展至今，已经超过10年，从最早的EasyPlayerRTSP播放器，到如今维护的3条线：EasyPlayer-RTSP播放器：Windows、Android、iOS；EasyPlayerPro播放器：Windows、Android、iOS；EasyPlayer.js播放器：H5；这3个播放器各有各的应用场景，用户量也是巨大，像RTSP版本的播放器，到今天依然还有很多低
京东家电年销售额是去年的1300%，主要来自于他.... Shanshan小课堂
经过大半个月角逐纠缠，时间终于来到6月18日，618全球年中购物节迎来最高潮。作为国内最大的家电零售平台，京东家电从18日0点开始，便开启了飞速狂奔的模式，仅8分钟销售额就突破20亿元!展现出强劲的增长势头与家电主场的王者霸气的同时，也让各家电品牌实现了爆发式增长，美的、海尔、格力、奥克斯均在3分钟内突破1亿元大关。在今年的618中，除了消费者已经熟悉的网购形式外，线上线下联动的融合模式、社交电商
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

基于国产手机 SoC 的多模态模型推理加速实战：GPU × NPU 协同优化全流程解析