Diffusion论文解读第6页

DREAMFUSION: TEXT-TO-3D USING 2D DIFFUSION

ABSTRACTRecentbreakthroughsintext-to-imagesynthesishavebeendrivenbydiffusionmodelstrainedonbillionsofimage-textpairs.Adaptingthisapproachto3Dsynthesiswouldrequirelarge-scaledatasetsoflabeled3Ddataande

于初见月·2025-02-05 01:34

Stable Diffusion：建筑方案设计新利器_stable diffusion建筑装修模型

StableDiffusion作为一款强大的AI图像生成模型，具有诸多显著特点。首先，它开源免费，这意味着任何人都可以自由使用和修改，为艺术创作、设计等领域的从业者和爱好者提供了极大的便利。用户无需支付费用，就能享受到高质量的图像生成服务，极大地降低了创作成本。在控制力方面，StableDiffusion表现出色。它支持更加详细的Prompt设计，用户可以输入更长的文本描述，如人物特征、动作、环境

AI绘画师-海绵·2025-02-04 14:14

Diffusion--人工智能领域的革命性技术

在人工智能领域，“diffusion”一词通常指的是“扩散模型”（DiffusionModels），其全称为“DenoisingDiffusionProbabilisticModels”（DDPMs）。

油泼辣子多加·2025-02-04 04:20

Stable Diffusion 创始人看不下去了：DeepSeek 没抄袭！

DeepSeek引发的热议DeepSeek在AI界掀起波澜，受到关注的同时，不少人对其抄袭指控纷纷而至。争论中的焦点在于其技术的独特性与法律合规。引发此风波的核心在于其是否真的具备自主创新的能力。EmadMostaque的角色作为StableDiffusion的创始人，EmadMostaque是AI领域的重要人物。他不仅推动了开源技术的发展，也在这场争论中挺身而出，为DeepSeek辩护。Emad

TGITCIC·2025-02-03 06:25

Stable Diffusion 3 与 OpenAI 的 DALL-E 3 谁才是AI绘画的扛把子?

StableDiffusion3和OpenAI的DALL-E3是当前最顶尖的两种AI图像生成模型，它们在技术架构、应用场景和性能表现上各有特点。以下从多个角度详细比较这两种模型：1.开发背景与架构StableDiffusion3是由StabilityAI开发的开源模型，基于扩散Transformer架构和流匹配（FlowMatching）技术，支持多种参数配置（从800M到8B），能够满足多样化的

kcarly·2025-02-03 06:23

Stable Diffusion 3.5 正式发布！免费开源，堪称最强AI文生图模型，附本地安装和在线使用教程

关键要点：10月22日，stability.ai重磅推出StableDiffusion3.5，号称迄今为止最强大的文生图模型。此次公开版本包括多个模型变体，其中有StableDiffusion3.5Large和StableDiffusion3.5LargeTurbo。此外，StableDiffusion3.5Medium将于10月29日发布。这些模型在尺寸方面具有高度可定制性，可在消费级硬件上运行

Qingmu2024·2025-02-03 06:23

Stable Diffusion创始人：DeepSeek没有抄袭！

Datawhale分享观点：EmadMostaque，编译：Datawhale视频中英对照如下：Distillationisnothingnew,andthere'snowaytokindofstopthisfromthemodelbasis.蒸馏技术并不是什么新事物，而且从模型的角度来看，没有办法完全阻止这种情况的发生。Butifyouactuallylookatwhatthepapersays

Datawhale·2025-02-03 06:51

【书生·浦语大模型实战营】学习笔记（三）：“茴香豆” 搭建你的RAG 智能助理

GoAI·2025-02-03 05:10

Fooocus AI绘画神器兼具Midjourney和Stable Diffusion强大功能，win版本整合包一键运行N卡版（8g内存4g显卡可操作硬盘空间要500g），省去繁琐的安装（A卡改参数）

开源AI绘画工具Fooocus使用指南最近，在Github上一款全新的开源AI绘画工具Fooocus横空出世，引发了众多AI绘画爱好者的关注。它不仅能够像StablediffusionWebUI一样部署到本地免费使用，还具备midjourney那般便捷的操作界面，为用户带来了极其出色的创作体验。Foocus重新思考了图像生成器的设计。该软件是离线的，开源的，免费的，同时，类似于许多在线图像生成器，

struggle2025·2025-02-02 15:30

【AI日记】25.01.25

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AIkaggle比赛：ForecastingStickerSales读书书名：法治的细节律己AI：8小时，良作息：00

AI完全体·2025-02-01 23:42

【AI知识点】三种不同架构的大语言模型（LLMs）的区别

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】在自然语言处理（NLP）中，预训练语言模型（LLMs,LargeLanguageModels）通常基于不同的架构，如仅编码器的模型（Encoder-only

AI完全体·2025-02-01 23:09

LoongServe论文解读：prefill/decode分离、弹性并行、零KV Cache迁移

LoongServe论文解读：prefill/decode分离、弹性并行、零KVCache迁移LoongServe:EfficientlyServingLong-contextLargeLanguageModelswithElasticSequenceParallelism

04290629·2025-01-30 18:13

【书生·浦语大模型实战营】学习笔记（五）：LMDeploy 量化部署

GoAI·2025-01-30 03:18

GPTHUB

支持一键切换ChatGPT(3.5、4.0)模型、月之暗面（Kimi）、文心一言(支持Stable-Diffusion-XL作图)、通义千问、讯飞星火、智谱清言(ChatGLM)等主流模型，后续模型持续对接中

@小马哥·2025-01-29 13:24

Qwen-VL论文解读

Qwen-VL：用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中，我们介绍了Qwen-VL系列，这是一组大规模的视觉-语言模型（LVLMs），旨在感知和理解文本和图像。从Qwen-LM开始，我们通过精心设计的（i）视觉受体，（ii）输入-输出接口，（iii）3阶段训练管道，以及（iv）多语言多模态清洗语料库，赋予其视觉能力。除了传统的图像描述和问答，我们还通过图像-标题-框元组的对齐实现

dream_home8407·2025-01-29 09:10

CT-Mamba:一种用于低剂量CT降噪的混合卷积状态空间模型论文解读

论文：CT-Mamba:AHybridConvolutionalStateSpaceModelforLow-DoseCTDenoising代码：zy2219105/CT-Mamba，作者称将会在论文正式发表后提供。本文参考了该网站，其对CT-Mamba提供了更详细的描述：https://www.aimodels.fyi/papers/arxiv/ct-mamba-hybrid-convolutio

ZcZc__1·2025-01-28 17:52

AI大模型DreamShaper XL v2系列分享，适用于Stable Diffusion和ComfyUI

DreamShaperXLv2TurboDPMpp_v2Turbo通过百度网盘分享的文件：DreamShaperXLv2TurboDPMpp_v2TurboDPMpp.safetensors链接:https://pan.baidu.com/s/1ja-9GrFPy7enGKAO-cUUFQ?pwd=5566提取码:5566–StableDiffusion放在models\Stable-diffus

szboy2003·2025-01-28 13:52

手撕Diffusion系列 - 第八期(end) - Diffusion推理

手撕Diffusion系列-第八期(end)-Diffusion推理目录手撕Diffusion系列-第八期(end)-Diffusion推理DDPM原理图DDPM反向去噪DIffusion推理代码Part1

小菜鸟博士·2025-01-28 13:52

开放传神（OpenCSG）手撕Sora的Diffusion Transformer (DiT)算法

“Sora的出现不是偶然，而是经过长期积累、反复试错及用户反馈的必然。”OpenAI尝试过递归网络、生成对抗网络、自回归Transformer及扩散模型。最终诞生了DiffusionTransformer。其充分利用了大语言模型Token的好处，让像素也能够被预测（Patches）。Sora的诞生不亚于2023年ChatGPT的出现，因为我们的世界是一个五彩斑斓的图像和视频组成。Sora通过社区和

OpenCSG·2025-01-28 13:20

深入浅出解析Stable Diffusion中U-Net网络

题解|#数组中出现次数超过一半的数字#importjava.util.*;publicclassSolution{/***代码中的类名、方法名、参数名已经指定，请勿修改，24秋招腾讯QQ浏览器提前批一面一面（35分钟）先做个自我介绍你应该学过操作系统和计算机网络进程和线程UDP和TCP的区别UDP和TCP如何实现拥塞控制什么情况下用UDP，什么情况下用TCP题解|#牛牛学说话之-浮点数##incl

2301_78234743·2025-01-28 12:49

Stable Diffusion：Python图像生成实战指南

前言今天要跟大家分享一个特别有趣的话题-如何使用Python和StableDiffusion来生成AI艺术作品。作为一名Python爱好者，我特别喜欢探索AI领域的新技术，而StableDiffusion则是最近特别火热的AI图像生成工具之一。1.StableDiffusion简介与环境配置StableDiffusion是一个强大的AI图像生成模型，它能够根据文字描述生成高质量的图像。在开始实战之

AI绘画咪酱·2025-01-28 03:44

ViT论文解读

ViT论文解读本文主要记录YiZhu大佬对于ICLR2021的一篇论文精读ANIMAGEISWORTH16x16WORDS:TRANSFORMERSFORIMAGERECOGNITIONATSCALE论文地址

freshfish丶·2025-01-27 18:35

[论文精读]Understanding Diffusion Models: A Unified Perspective

发布链接：http://arxiv.org/abs/2208.11970文章详细讨论了扩散模型（DiffusionModels）作为一种生成模型的工作原理，并从多个角度解释其背后的数学机制。阅读原因：实验需要理解SD的数学建模过程数学层面更好的解释：diffusionmodel(一)：DDPM技术小结(denoisingdiffusionprobabilistic)|莫叶何竹1.扩散模型简介扩散模

0x211·2025-01-27 16:26

基于Stable Diffusion 3.5 Large模型的微调技术详解

基于StableDiffusion3.5Large模型的微调技术详解引言StableDiffusion3.5Large（以下简称SD3.5）是近年来在生成式AI领域备受关注的一个模型，尤其在图像生成任务中表现出色。它基于扩散模型（DiffusionModel）的架构，能够生成高质量的图像，并且在文本到图像（Text-to-Image）任务中展现了强大的能力。然而，尽管SD3.5在通用图像生成任务中

zhangjiaofa·2025-01-27 08:28

在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（上）

背景介绍在2024年的亚马逊云科技re:Invent大会上提前预告的StableDiffusion3.5Large，现在已经在AmazonBedrock上线了！各位开发者们现在可以使用该模型，根据文本提示词文生图生成高质量的图片，并且支持多种图片风格生成，助力媒体、游戏、广告和零售等行业的开发者们加速概念艺术、视觉特效以及精修产品宣传图的生成创作。2024年10月，图像生成模型厂商Stabilit

佛州小李哥·2025-01-27 06:20

Classifier Guidance 与 Classifier-Free Guidance

ClassifierGuidance与Classifier-FreeGuidanceDDPM终于把diffusion模型做work了，但无条件的生成在现实中应用场景不多，我们终归还是要可控的图像生成。

Adenialzz·2025-01-26 18:22

Diffusion中guidance_scale 的理解

guidance_scale是一个控制生成图像引导程度的参数。它的含义和使用与论文Imagen:PhotorealisticText-to-ImageDiffusionModelswithComposableConditions中的公式(2)的引导权重类似。1.Classifier-FreeGuidance的背景Classifier-FreeGuidance是一种在扩散模型中提高生成样本质量的方法

不当菜鸡的程序媛·2025-01-26 18:50

【大模型】AutoDL部署AI绘图大模型Stable Diffusion使用详解

目录一、前言二、AI绘图大模型概述2.1AI绘图大模型介绍2.2AI绘图大模型特点2.3AI绘图大模型优势三、主流的AI绘图大模型介绍3.1Midjourney3.1.1Midjourney介绍3.1.2Midjourney功能特点3.1.3Midjourney使用场景3.2StableDiffusion3.2.1StableDiffusion介绍3.2.2StableDiffusion特点3.2

小码农叔叔·2025-01-25 07:19

stable diffusion webui电商基础模型

电商生成模型的产生主要有两个路子，1.训练微调；2.模型融合。下面这些是借鉴，帮助思考如何构建电商模型。电商必备的10款StablediffusionWebUI模型-知乎一、WFProduct电商场景这是一个专门为电商摄影场景训练的lora模型，可以生成各种极具设计感的场景图，效果逼真，无论是电商、海报、产品渲染还是空间布置上都能用得到，可以解决产品摄影空间布景困难、创意度不…https://zh

Kun Li·2025-01-25 05:06

stable diffusion 模型和lora融合

炜哥的AI学习笔记——SuperMerger插件学习-哔哩哔哩接下来学习的插件名字叫做SuperMerger，它的作用正如其名，可以融合大模型或者LoRA，一般来说会结合之前的插件LoRABlockWeight使用，在调整完成LoRA模型的权重后使用改插件进行重新打包。除了LoRA，Checkpoint也可以通过这个插件进行融合合并。实际上，目前市面上存在大量的Checkpoint模型都是经由合并

Kun Li·2025-01-25 05:06

入门Stable-Diffusion-WebUI全过程

这里用的软件叫“stable-diffusion-webui”，严格意义上来说是一个基于StableDiffusion的开源项目。

沙漠蓝色披头·2025-01-25 01:03

如何训练Stable Diffusion 模型

训练StableDiffusion模型是一个复杂且资源密集的过程，通常需要大量的计算资源（如GPU或TPU）和时间。StableDiffusion是一种基于扩散模型的生成式AI，能够根据文本提示生成高质量的图像。它的训练过程涉及多个步骤，包括数据准备、模型配置、训练参数调整等。以下是训练StableDiffusion模型的基本步骤和注意事项：1.环境准备1.1安装依赖项首先，确保你有一个适合深度学

俊偉·2025-01-25 00:59

AAAI2024论文解读|Memory-Efficient Reversible Spiking Neural Networks-water-merged

论文标题Memory-EfficientReversibleSpikingNeuralNetworks内存高效可逆脉冲神经网络论文链接Memory-EfficientReversibleSpikingNeuralNetworks论文下载论文作者HongZhang,YuZhang内容简介本文提出了一种可逆脉冲神经网络（RevSNN），旨在降低脉冲神经网络（SNNs）在训练过程中对中间激活和膜电位的内

paixiaoxin·2025-01-24 16:22

自学成才之路，DeepSeek R1 论文解读

DeepSeekR1的论文看完后，后劲很大。虽然我推荐所有人都去阅读一下，但我估计实际去读的人应该很少。今天把论文里的三个亮点，用通俗易懂地方式写出来，希望能让更多人了解这篇论文有多么重要。亮点一：告别“刷题班”，纯“实战”也能练出推理大神！我们平时学习，是不是经常要“刷题”？做大量的练习题，才能巩固知识，提高解题能力。以前训练AI模型，也差不多是这个套路，要先给AI“喂”大量的“习题”（监督数据

智识世界Intelligence·2025-01-24 01:24

【AI日记】25.01.22

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AIkaggle比赛：ForecastingStickerSales读书书名：自由宪章，论美国的民主阅读原因：了解美国的架构设计和底层原理

AI完全体·2025-01-23 09:03

全网最全Stable diffusion保姆级教程「安装-配置-画图」，小白必收藏！！

随着chatgpt爆火之后，越来越多的人开始关注人工智能，人工智能相关的其他应用如AI绘画，也再次得到人们的关注。AI绘画的确很上头，最近几天小编也研究一下，这里把研究的过程以及中间遇到的问题整理一下，我这里遇到的问题，相信新入门的小白也会遇到，希望本文对你能有一定的帮助。给大家带来了全新保姆级教程资料包（文末可获取）目前常用的AI绘画工具主要有两种：stablediffusion和midjour

AI想象家·2025-01-21 15:46

vid2vid-zero：使用Stable Diffusion进行零样本视频编辑

Paper:WangW,JiangY,XieK,etal.Zero-shotvideoeditingusingoff-the-shelfimagediffusionmodels[J].arXivpreprintarXiv:2303.17599,2023.Introduction:UnreleasedCode:https://github.com/baaivision/vid2vid-zero目录一

ScienceLi1125·2025-01-21 14:12

开源AI图像工具—Stable Diffusion

StableDiffusion是一种基于深度学习的生成式模型，用于图像生成、图像修复和风格转换等任务。它是由StabilityAI和CompVis团队联合开发的。StableDiffusion在生成高质量图像方面表现出色，并且是开源的，可以自由使用和扩展。StableDiffusion的核心技术1.扩散模型(DiffusionModels):•基于概率生成模型。•从噪声中逐步反向生成清晰的图像。•

蚂蚁在飞-·2025-01-21 14:41

AAAI2024论文解读|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心

论文标题TowardsFairerCentroidsink-meansClustering面向更公平的k均值聚类中心论文链接TowardsFairerCentroidsink-meansClustering论文下载论文作者StanleySimoes,DeepakP,MuirisMacCarthaigh内容简介本文提出了一种新的聚类级质心公平性（Cluster-levelCentroidFairne

paixiaoxin·2025-01-21 10:10

深入理解AIGC背后的核心算法：GAN、Transformer与Diffusion Models

深入理解AIGC背后的核心算法：GAN、Transformer与DiffusionModels前言随着人工智能技术的发展，AIGC（AIGeneratedContent，人工智能生成内容）已经不再是科幻电影中的幻想，而成为了现实生活中的一种新兴力量。无论是自动生成文章、绘制图像、生成音乐还是创作视频，AIGC都在各个内容创作领域崭露头角。然而，这些“智能创作”的背后究竟依赖于哪些算法？今天，我们将

忘梓.·2025-01-21 10:36

【AI日记】25.01.06

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AI参加：kaggle比赛ForecastingStickerSales读书书名：国家为什么会失败阅读原因：2024

AI完全体·2025-01-21 01:08

Stable Diffusion 3(SD 3)模型分享

整理了StableDiffusion3(SD3)模型，分享如下：sd3_medium.safetensors链接:https://pan.baidu.com/s/1aYq0MTmKj0U9fBNexV-7sw?pwd=5566提取码:5566sd3_medium_incl_clips_t5xxlfp8.safetensors链接:https://pan.baidu.com/s/1cg3zESBk0

szboy2003·2025-01-20 21:01

ACL 2024 | 美团技术团队精选论文解读

本文精选了美团技术团队被ACL2024收录的4篇论文进行解读，论文内容覆盖了训练成本优化、投机解码、代码生成优化、指令微调（IFT）等技术领域。这些论文是美团技术团队跟高校、科研机构合作的成果。希望能给从事相关研究工作的同学带来一些帮助或启发。ACL是计算语言学和自然语言处理领域最重要的顶级国际会议，由国际计算语言学协会组织，每年举办一次。据谷歌学术计算语言学刊物指标显示，ACL影响力位列第一，是

·2025-01-18 05:12

让创意在幻觉中肆虐: 认识Illusion Diffusion AI

人工智能新境界在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注IllusionDiffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。AI算法的魔力所在IllusionDiffusion的核心是借助先进的AI模型,包括StableDiffusion和ControlNet,来解读用户输入的文本提示,并生成相应的

·2025-01-18 05:12

KDD 2024 | 美团技术团队精选论文解读 & 论文分享会预告

ACMSIGKDD（KnowledgeDiscoveryandDataMining，简称KDD）是数据挖掘领域的国际顶级会议。KDDCup比赛是由SIGKDD主办的数据挖掘研究领域的国际顶级赛事，从1997年开始，每年举办一次，是目前数据挖掘领域最有影响力的赛事。本文精选了美团技术团队被KDD2024收录的5篇长文进行解读，覆盖了用户意图感知、机器学习&运筹优化、在线控制实验、联合广告模型、实时调

·2025-01-17 19:29

VLM 系列——Qwen2 VL——论文解读——前瞻（源码解读）

一、概述1、是什么是一系列多模态大型语言模型（MLLM），其中包括2B、7B、72B三个版本，整体采用视觉编码器+LLM形式（可以认为没有任何投射层）。比较创新的是图像缩放方式+3DLLM位置编码+（预估后面的训练方式也不太一样）。能够处理包括文本、图像在内的多种数据类型，具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解（代码编写和debug论文暂时

TigerZ*·2025-01-16 18:48

【笔记】扩散模型（七）：Latent Diffusion Models（Stable Diffusion）论文解读与代码实现

论文链接：High-ResolutionImageSynthesiswithLatentDiffusionModels官方实现：CompVis/latent-diffusion、CompVis/stable-diffusion

LittleNyima·2024-09-15 00:42

Stable Diffusion-AI美女模特写真使用InstantID插件（附插件）

ControlNet单元1：上传人脸定位照上传任意一张照片，它的作用是控制最终出图的人物脸部位置。我们可以和第一张图片一样。相关[参数设置如下：控制类型：选择"Instant_ID"预处理器：instant_id_face_keypoints模型：control_instant_id_sdxl控制权重：0.5左右（0.45-0.5）【第四步】图片的生成点击【生成】按钮，我们来看一下最终生成的图片效

快乐星球没有乐·2024-09-12 16:08

Midjourney和 Stable Diffusion，学谁呢?

Midjourney是在线的，可以使用文字制作令人惊叹的AI图片。它与StableDiffusion类似，但也有一些区别。Midjourney只能在互联网上使用，并且需要付费。那么，值得为Midjourney付费吗？它与稳定扩散有何不同？MidjourneyvsStableDiffusion——功能比较您将在本节中找到StableDiffusion和Midjourney之间的详细比较。与Midjo

Ai君臣·2024-09-12 14:40

【Vidu发布】中国首个长时长、高一致性、高动态性Video AI大模型

该模型采用生数科技团队原创的Diffusion与Transformer融合的架构U-ViT。

叶锦鲤·2024-09-12 13:44

推荐频道

Diffusion论文解读