上总介

【论文阅读】ControlNet、文章作者 github 上的 discussions

文章目录

Introduction
Method
- ControlNet
- ControlNet for Text-to-Image Diffusion
- Training
- Inference
Experiments
- 消融实验
- 定量分析
在作者 github 上的一些讨论
- 消融实验更进一步的探索
- Precomputed ControlNet 加快模型推理
- 迁移控制能力到其他 SD1.X 模型上
- 其他

Introduction

提出ControlNet，通过引入该结构微调预训练文生图扩散模型，可以给模型增加空间定位条件.
在Stable Diffusion上使用ControlNet微调，使模型能接受 Canny edges, Hough lines, user scribbles, human key points, segmentation maps, shape normals, depths, cartoon line drawings 图像作为输入条件.
消融实验、定量分析、对比 baseline.

Method

ControlNet

考虑一个预训练好的神经网络 $\mathcal{F}(·;\Theta)$ 表示训练好的神经网络块，它的内部结构可以包括 resnet, conv-bn-relu, muti-head att, transfomer 等. 输入 $x\in\mathbb{R}^{h\times w\times c}$ ，将其转换到 $y$ ，也即

$\large y=\mathcal{F}(x;\Theta)$

使用ControlNet微调神经网络 $\mathcal{F}(·;\Theta)$ ，首先复制 $\mathcal{F}(·;\Theta)$ 的结构和参数，参数命名为 $\Theta_{c}$ ，同时冻结 $\Theta$ . 然后在复制结构的前和后分别引入zero convolution，也即核大小为 $1\times1$ 、初始参数为 $0$ 的卷积层，分别用 $\mathcal{Z}(·;\Theta_{z1})$ 和 $\mathcal{Z}(·;\Theta_{z2})$ 表示. 最后，将 $c$ 作为微调时的条件，将其整合到模型的前向计算中，具体表示为

$\large y_c=\mathcal{F}(x;\Theta)+\mathcal{Z}(\mathcal{F}(x+\mathcal{Z}(c;\Theta_{z1});\Theta_c);\Theta_{z2})$

模型结构如下所示：

在训练的第一步中，zero convolution的参数都为 $0$ ，因此模型输出和未加入ControlNet的输出一样，这样做有助于在刚开始训练时保护微调结构的 backbone，使其免受随机噪声的污染.

ControlNet for Text-to-Image Diffusion

众所周知，Stable Diffusion训练时的网络有这么几个部分构成：

FrozenCLIPEmbedder是一个预训练的 text encoder，将 prompt 嵌入成条件向量，一般情况下参数冻结.
AutoencoderKL是一个预训练的 image encoder，将图像从像素空间转换到隐空间，降低扩散过程中图像向量的尺寸，一般情况下参数冻结.
UNet，主要需要训练的部分，模拟隐空间上图像在数据分布和高斯分布之间转换的过程. 结构上主要包含：
- 若干 encoder 块，主要由 resnet, transformer, avg_pool 组成，用于逐层提取特征.
  - resnet 块融合图像隐向量和扩散时间步的嵌入向量
  - transformer 块融合图像隐向量和 prompt 条件向量
- 一个 middle 块，由 resnet 和 transformer 组成
- 若干 decoder 块，主要由 resnet, transformer, interpolate 组成，用于融合深层特征和浅层特征.

将ControlNet应用于Stable Diffusion做微调，也即应用于其中UNet的 decoder 部分，使这部分网络能进一步融合作为条件的图像。用 $t$ 表示时间步， $c_t$ 表示 prompt 条件， $c_f$ 表示条件图像在隐空间上的表示，修改后的UNet结构为

Training

用 $z_0$ 表示原始图像的隐向量，经过时间步 $t$ 后加噪的图像表示为 $z_t$ ，应用了ControlNet的UNet表示为 $\epsilon_{\theta}$ ，训练时的损失函数可以表示为

$\large \mathcal{L}=\mathbb{E}_{ z_0,t,c_t,c_f,\epsilon\in\mathcal{N}(0,I)}\left[||\epsilon-\epsilon_{\theta}(z_t,t,c_t,c_f)||_2^2\right]$

在实际训练过程中，作者随机将 $50\%$ 的 prompt 置为空字符串，这种做法能使ControlNet学习到图像条件的语义信息. 由于zero convolution不会引入额外的噪声，因此在训练过程中整个Stable Diffusion模型仍然能生成高质量的图片. 基于这一特性，作者观察到，微调时模型并非逐渐学习到图像条件，而是在训练步数低于 $10\mathrm{K}$ 时的某一步开始突然遵从图像条件. 作者称这其为 “sudden convergence phenomenon”

Inference

Stable Diffusion使用CFG控制条件强弱，令 $\epsilon_{uc}$ 表示无 prompt 条件的模型输出， $\epsilon_{c}$ 表示有 prompt 条件的模型输出，超参数 $\beta_{cfg}$ 表示 prompt 条件的强弱，模型最终的输出 $\epsilon_{prd}$ 可以表示为

$\large \epsilon_{\mathrm{prd}}=\epsilon_{\mathrm{uc}}+\beta_{\mathrm{cfg}}(\epsilon_{\mathrm{c}}-\epsilon_{\mathrm{uc}})$

在没有 prompt 条件的极端情况下，如果抽取完深层特征的图像条件同时加到 $\epsilon_{uc}$ 和 $\epsilon_{c}$ 上，这会使CFG完全失去控制条件强弱的作用；如果只加到 $\epsilon_{c}$ 上，又会使控制条件对输出图像的影响过大. 因此，作者提出一种叫做Classifier-free guidance resolution weighting(CFG-RW)的方法. 具体做法，把图像条件加到 $\epsilon_{c}$ 上，在ControlNet每一层输出加回UNet前乘系数 $w_i$ ( $64/h_i$ ， $h_i$ 为第 $i$ 个 decoder 块的尺寸). 下图分别展示了该讨论各种情况下的输出图像：

有了上述方法之后，结合不同类别的图像条件，也只需要对应相加即可.

Experiments

消融实验

探索ControlNet其他可能结构

将zero convolution换成随机初始化的卷积层
只使用一个卷积层作为ControlNet

定量分析

作者使用 ADE20K 作为测试集，在 OneFormer 上做语义分割，对比不同方法重构图像和原图像的 IoU .

之后，作者评估了不同模型的 FID、CLIP score、CLIP aesthetic score.

下图展示了不同模型实际生成的图片

在作者 github 上的一些讨论

消融实验更进一步的探索

discussion 链接
将ControlNet简化为ControlNet-lite和ControlNet-mlp两种模型：

作者从根据一张房子的图片做了简单地涂鸦风格处理，作为控制条件

【论文阅读】ControlNet、文章作者 github 上的 discussions_第9张图片

【论文阅读】ControlNet、文章作者 github 上的 discussions_第10张图片

在精心设计 prompt 的情况下，发现原版模型和改后的两种模型输出的图像效果都不错.

Professional high-quality wide-angle digital art of a house designed by frank lloyd wright. A delightful winter scene. photorealistic, epic fantasy, dramatic lighting, cinematic, extremely high detail, cinematic lighting, trending on artstation, cgsociety, realistic rendering of Unreal Engine 5, 8k, 4k, HQ, wallpaper

（分别为`ControlNet`、`ControlNet-lite`、`ControlNet-mlp`的输出）

但是当 prompt 为空时，两种改版都很拉胯.

（分别为`ControlNet`、`ControlNet-lite`、`ControlNet-mlp`的输出）

一方面，这样的对比说明更深的 encoder 结构确实拥有更强的识别能力，所以如果你的目标是训练稳健的ControlNet投入到生产环境，这样的识别能力是很重要的. 反之，如果用来做解决特定问题的研究或者训练集足够简单，那可以考虑轻量化的方案.
另一方面，这也解释了ControlNet接受 prompt 条件和时间步输入是重要的，因为这么做可以让使用者仍然能靠 prompt 条件调整模型的输出.

Precomputed ControlNet 加快模型推理

discussion 链接
主要 idea 如下图所示：

这样做可以提前计算好ControlNet中每个块的输出，在推理时直接加到原模型的UNet上.
作者观察到这样训练的模型生成的图像更假，并且更不稳健，以失败告终.
评论中有人提到可以尝试使用 NAS (neural architecture search) 探索更好的模型结构，以降低 GPU 消耗.

迁移控制能力到其他 SD1.X 模型上

discussion 链接
作者尝试将在 Stable Diffusion 1.5上训练的ControlNet迁移到AnythingV3上，作者给出的方法是：

AnythingV3_control_openpose = AnythingV3 + SD15_control_openpose – SD15

限制有两点：

text encoder 不同会导致意外结果
在例如 human pose 的应用中，输入最好不是二刺螈人物图片，因为检测姿势用的 OpenPose 不擅长处理二刺螈人物.

这种方法已经过时了. 目前在实际应用中，直接把ControlNet插到其他 SD1.X 模型上就行.

其他

Riffusion + ControlNet 音乐修复
将原图转换成像素风格
人物换衣
调色

你可能感兴趣的:(论文阅读,AIGC,stable,diffusion)

GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
2025年海外短剧CPS分销系统开发：技术架构与商业化实战指南
一、市场爆发：万亿级赛道的结构性机遇2025年海外短剧市场迎来指数级增长，SensorTower数据显示，仅第一季度应用内购收入就达7亿美元，全年预计突破45亿美元。美国贡献49%收入，东南亚以9%增速成为新兴增长极。这种爆发式增长源于三大驱动力：用户行为变迁：全球短视频用户突破20亿，微短剧月活用户仅8000万，渗透率不足10%，存在11倍增长空间技术赋能创新：AI生成内容（AIGC）降低制作成
5个必知的AIGC工具，轻松打造爆款虚拟偶像 AI原生应用开发 AI 原生应用开发实战 AIGC ai
5个必知的AIGC工具，轻松打造爆款虚拟偶像关键词：AIGC工具、虚拟偶像、AI生成内容、数字人建模、智能交互、语音合成、动画生成摘要：本文深度解析5款前沿AIGC工具在虚拟偶像打造中的核心应用，涵盖从形象设计、语音生成到动态交互的全流程技术实现。通过MidJourney、D-ID、MetaHuman、RunwayML、VoiceMaker等工具的原理剖析、操作指南及实战案例，揭示如何利用AI技术
AIGC 领域 AI 写作在电商文案中的应用技巧 SuperAGI架构师的AI实验室 AI大模型应用开发宝典 AIGC 人工智能 easyui ai
AIGC领域AI写作在电商文案中的应用技巧关键词：AIGC、AI写作、电商文案、内容生成、自然语言处理、营销自动化、个性化推荐摘要：本文深入探讨了AIGC（人工智能生成内容）技术在电商文案创作中的应用技巧。文章首先介绍了AIGC的基本概念和发展现状，然后详细分析了AI写作在电商领域的核心应用场景和技术原理。通过具体的算法解析、数学模型和实际案例，展示了如何利用AI技术提升电商文案的创作效率和质量。
AIGC时代，营销人需要掌握的5项新技能 SuperAGI架构师的AI实验室 AI大模型应用开发宝典 AIGC ai
AIGC时代，营销人需要掌握的5项新技能关键词：AIGC、营销转型、内容生成、数据驱动、人机协作、技能升级、数字营销摘要：随着生成式人工智能(AIGC)技术的快速发展，营销行业正在经历前所未有的变革。本文详细分析了在AIGC时代营销人必须掌握的5项核心新技能，包括AIGC工具应用、数据思维、创意管理、人机协作和伦理意识。通过生动的案例和实用的建议，帮助营销从业者顺利实现技能升级，把握AI时代的营销
AIGC领域MCP模型上下文协议：数据处理的新方案 AI大模型应用工坊 AIGC ai
AIGC领域MCP模型上下文协议：数据处理的新方案关键词：AIGC、MCP模型、上下文协议、多模态数据处理、动态上下文管理、长序列建模、语义连贯性摘要：随着AIGC（人工智能生成内容）技术的快速发展，多模态生成、长文本创作、跨场景对话等任务对上下文管理提出了更高要求。传统上下文处理方案因碎片化、语义断层、动态适应性差等问题，难以满足复杂场景需求。本文聚焦AIGC领域的MCP（Multi-Conte
百度大涨，AIGC视频生成模型蒸汽机将会给百度带来什么？
百度7月23日盘中表现强势，盘中一度涨4.49%。消息面上，百度旗下百度商业研发团队自研的AIGC视频生成模型蒸汽机(MuseSteamer)正式上线手机网页版，支持用户通过移动端一键生成电影级视频。百度的大涨我们该怎么分析？首先，百度股价的上涨反映了市场对其新推出的AIGC视频生成模型蒸汽机的高度认可和期待。这款模型能够支持用户通过移动端一键生成电影级视频，显示出百度在人工智能技术应用领域的持续
Selenium自动化测试入门：从零到精通
文章目录一、前言1.浏览器驱动下载2.配置二、seleium使用教学1.基础框架2.常用操控浏览器的方法3.定位元素八种方法及其优缺点4.元素定位的隐性等待一、前言1.浏览器驱动下载chromedriver下载地址：https://googlechromelabs.github.io/chrome-for-testing/#stable谷歌浏览器网址栏输入：chrome://version查看你的
周三 2020-01-01 09:30 - 23:00 多云 03h35m 么得感情的日更机器
南昌。二〇二〇年一月一日基本科研[1]:1.论文阅读论文--小时2.论文实现论文编写--实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:开题报告--英语能力[2]:1.听力--十分2.单词--三分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正
linux----docker配置nginx详细教程黑子哥呢？运维 linux docker nginx 运维
在Docker中配置Nginx涉及多个步骤，包括拉取Nginx镜像、运行Nginx容器、配置Nginx以及管理Nginx容器等。以下是一个详细的指南：一、拉取Nginx镜像首先，需要从DockerHub拉取官方的Nginx镜像。可以使用以下命令：dockerpullnginx或者，如果需要特定版本的Nginx，可以指定版本号，例如：dockerpullnginx:stable#拉取最新稳定版本do
探索结合ChatGPT、Midjourney/Nijijourney、Stable Diffusion和Procreate创作动漫图片的工作流程 iCloudEnd
第一节：嘿ChatGPT，你能帮我写提示吗？引用OpenAI自己的描述，ChatGPT是InstructGPT的同级模型，它经过训练可以遵循提示中的指令并提供详细的响应。并且它还能够为图像生成编写提示:)首先，我首先选择了当天的服装：上衣：轻盈的白色长袖衬衫，带有精致的花卉印花。这件衬衫有V领口和飘逸的袖子。下装：我选择了一条高腰A字型中长半身裙，颜色为柔和的淡绿色，外加一双超透明连裤袜。这条裙子
零基础完整版入门经典深度学习时间序列预测项目实战+最新前沿时间序列预测模型代码讲解学习整理（附完整可运行代码） OverOnEarth 时间序列预测项目实战深度学习学习人工智能
专栏内容本专栏主要整理了作者在时间序列预测领域内的一些学习思路与代码整理，帮助大家在初进入此领域时，可以快速掌握代码进行实战操作，对代码的操作再结合论文阅读肯定是上升更快嘛，作者也愿意和大家一起讨论进步，下面的内容会逐步更新，作者主页的资源列也会放出一些可下载的资源供大家参考学习噢。一、LSTM时间序列预测完整代码示例学习分析（pytorch框架）精选试读文章二、LSTM多变量输入实现多步预测完整
生成式引擎优化（GEO）：AI时代网站优化的范式重构 GEO优化助手 AI搜索优化生成式引擎优化 GEO优化人工智能重构生成式引擎优化搜索引擎 GEO优化 AI搜索营销
在DeepSeek、文心一言等大模型驱动的AI时代，搜索引擎正经历从"信息检索工具"向"智能决策助手"的质变。据中国互联网信息中心数据显示，2025年AI生成内容（AIGC）在搜索结果中的占比已突破63%，传统SEO的关键词堆砌策略逐渐失效。生成式引擎优化（GEO）作为适配AI搜索的新兴学科，正在重构数字营销的底层逻辑。某美妆品牌通过关键词堆砌获得首页排名，但在文心一言的"2025职场穿搭"问答中
【AIGC调研系列】敢于挑战Transformer的新架构Megalodon有什么优势 Zachary AI AIGC调研相关 AIGC transformer 架构
Megalodon作为一种新架构，其优势主要体现在以下几个方面：无限上下文处理能力：Megalodon能够处理无限上下文，这一点在多个证据中得到了强调[1][2][3]。这意味着它能够在处理长文本时保持高效和准确，而不会因为上下文长度的限制而降低性能。高性能：在2万亿token的训练任务中，Megalodon的性能超越了Llama2-7B，实现了非凡的效率[1][2][3]。这表明Megalodo
【AIGC半月报】AIGC大模型启元：2024.04（下）
AIGC大模型启元：2024.04（下）(1)Llama-3（MetaLLM）(2)Eurux-8x22B（面壁智能）(3)MEGALODON（Meta上下文长度不受限的神经网络架构）(4)Phi-3Mini（微软-最强小参数大模型）(5)日日新5.0（商汤大模型5.0版）(6)中文版Llama3(7)Qwen1.5-110B（国产Llama3）(8)Vidu（国产Sora）(1)Llama-3（
stable diffusion No module named taming
图片gan模型部署报错。pipinstalltaming-transformersImportError:cannotimportname'VectorQuantizer2'from'taming.modules.vqvae.quantize'，用https://github.com/CompVis/taming-transformers/blob/master/taming/modules/vq
每日AIGC最新进展(65)：北大和快手联合提出视频生成基础大模型、香港大学提出基于物理常识的视频生成测评标准、MIT提出长纪录片生成模型沉迷单车的追风少年 Diffusion Models与深度学习 AIGC 人工智能深度学习扩散模型
DiffusionModels专栏文章汇总：入门与实战PyramidalFlowMatchingforEfficientVideoGenerativeModeling本研究提出了一种高效的视频生成建模框架，称为“金字塔流匹配”（PyramidalFlowMatching）。该方法旨在解决当前视频生成模型在处理大规模时空数据时所面临的高计算和数据需求问题。传统的级联架构虽然能够减轻计算负担，但由于各
250714脑电分析课题进展——基础知识扩展与论文阅读
脑电分析课题进展目录脑电分析课题进展一、概要二、论文阅读（一）内容（二）创新（三）不足三、书籍阅读四、基础知识学习（一）机器学习（二）代码能力五、总结与展望一、概要本周课题进展聚焦于论文与书籍阅读，以及基础知识的学习（包括机器学习与PyTorch的代码学习）论文阅读以毕明川学姐的学位论文为参考《基于EEG的冥想状态数据挖掘研究》书籍阅读以李颖洁的《脑电信号分析方法及其应用》第一章内容为重点机器学习
速看！近屿OJAC发布全新AIGC大模型工程师工程师和产品经理学习路径图!
近期，AIGC大模型以其强大的能力和高效的性能，在人工智能领域迅速崭露头角。作为一种创新的AI技术，AIGC大模型的出现无疑为AI领域的发展带来了新的活力和可能。AIGC大模型的火速发展，得益于其出色的学习和处理能力。该模型能够快速理解、学习和处理大量的数据，然后生成准确的结果。这种能力使得AIGC大模型在诸多领域都有着广泛的应用前景，例如自然语言处理、图像识别、语音识别等，并衍生出了各种新型AI
[论文阅读] 人工智能 + 软件工程 | LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力张较瘦_ 前沿技术论文阅读人工智能软件工程
LLM当“裁判”靠谱吗？——解析代码生成与总结任务中的LLM评判能力论文：OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationarXiv:2507.16587OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationGiuseppeCrupi
[论文阅读] 人工智能 + 软件工程 | LLM优化RTL代码：在时序逻辑面前栽了跟头？—— 一项基于变形策略的实证研究张较瘦_ 前沿技术论文阅读人工智能
LLM优化RTL代码：在时序逻辑面前栽了跟头？——一项基于变形策略的实证研究论文标题：RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorphosisarXiv:2507.16808[pdf,html,other]RethinkingLLM-BasedRTLCodeOptimizationViaTimingLogicMetamorp
浅谈AI和开发者
AI是在帮助开发者还是取代他们？在软件开发领域，生成式人工智能（AIGC）正在改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试，AI工具正在成为开发者的得力助手。然而，这也引发了对开发者职业前景和技能需求变化的讨论。AI究竟是在帮助开发者还是取代他们？引言人工智能（ArtificialIntelligence，AI）作为一种新兴的技术，正在以前所未有的速度和规模改变着我们的生活和工作方
OEC 刷机Armbain 25.05后配置说明
DHCP调整为固定IPnano/etc/netplan/00-default-use-network-manager.yaml#AddedbyArmbian##Reference:https://netplan.readthedocs.io/en/stable/netplan-yaml/##LetNetworkManagermanagealldevicesonthissystem.#Anydevi
【扩散模型】正向扩散过程（Forward Diffusion）爱吃羊的老虎深度学习生成式模型机器学习人工智能深度学习 python
0.Diffusion模型是什么？DiffusionModel（扩散模型）是一类生成模型，可以从随机噪声逐步“还原”出高质量数据（如图像），其核心思想是：正向过程把数据逐步加噪变成纯噪声，反向过程学会从噪声中一步步“去噪”还原出原始数据。正向扩散过程（ForwardDiffusion）输入原始数据（如一张图像x0x_0x0）；按照某个“时间步数”t=1,2,...,Tt=1,2,...,Tt=1,
【部署模式演进】多实例 vs 多副本 vs 多租户：智能体平台部署结构深度解析观熵 Agentic AI架构实战全流程架构人工智能智能体 Agent
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他