E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Diffusion论文解读
DREAMFUSION: TEXT-TO-3D USING 2D
DIFFUSION
ABSTRACTRecentbreakthroughsintext-to-imagesynthesishavebeendrivenbydiffusionmodelstrainedonbillionsofimage-textpairs.Adaptingthisapproachto3Dsynthesiswouldrequirelarge-scaledatasetsoflabeled3Ddataande
于初见月
·
2025-02-05 01:34
paper
计算机视觉
Stable
Diffusion
:建筑方案设计新利器_stable
diffusion
建筑装修模型
StableDiffusion作为一款强大的AI图像生成模型,具有诸多显著特点。首先,它开源免费,这意味着任何人都可以自由使用和修改,为艺术创作、设计等领域的从业者和爱好者提供了极大的便利。用户无需支付费用,就能享受到高质量的图像生成服务,极大地降低了创作成本。在控制力方面,StableDiffusion表现出色。它支持更加详细的Prompt设计,用户可以输入更长的文本描述,如人物特征、动作、环境
AI绘画师-海绵
·
2025-02-04 14:14
stable
diffusion
人工智能
AIGC
AI作画
学习
科技
室内建筑
Diffusion
--人工智能领域的革命性技术
在人工智能领域,“
diffusion
”一词通常指的是“扩散模型”(DiffusionModels),其全称为“DenoisingDiffusionProbabilisticModels”(DDPMs)。
油泼辣子多加
·
2025-02-04 04:20
专业名词解释
人工智能
Stable
Diffusion
创始人看不下去了:DeepSeek 没抄袭!
DeepSeek引发的热议DeepSeek在AI界掀起波澜,受到关注的同时,不少人对其抄袭指控纷纷而至。争论中的焦点在于其技术的独特性与法律合规。引发此风波的核心在于其是否真的具备自主创新的能力。EmadMostaque的角色作为StableDiffusion的创始人,EmadMostaque是AI领域的重要人物。他不仅推动了开源技术的发展,也在这场争论中挺身而出,为DeepSeek辩护。Emad
TGITCIC
·
2025-02-03 06:25
AI-大模型的落地之道
deepseek
deepseek开源
开源deepseek
deepseek模型
deepseek抄袭
deepseek火
deepseek牛
Stable
Diffusion
3 与 OpenAI 的 DALL-E 3 谁才是AI绘画的扛把子?
StableDiffusion3和OpenAI的DALL-E3是当前最顶尖的两种AI图像生成模型,它们在技术架构、应用场景和性能表现上各有特点。以下从多个角度详细比较这两种模型:1.开发背景与架构StableDiffusion3是由StabilityAI开发的开源模型,基于扩散Transformer架构和流匹配(FlowMatching)技术,支持多种参数配置(从800M到8B),能够满足多样化的
kcarly
·
2025-02-03 06:23
杂谈
Stable
Diffusion
使用
stable
diffusion
AI作画
Stable
Diffusion
3.5 正式发布!免费开源,堪称最强AI文生图模型,附本地安装和在线使用教程
关键要点:10月22日,stability.ai重磅推出StableDiffusion3.5,号称迄今为止最强大的文生图模型。此次公开版本包括多个模型变体,其中有StableDiffusion3.5Large和StableDiffusion3.5LargeTurbo。此外,StableDiffusion3.5Medium将于10月29日发布。这些模型在尺寸方面具有高度可定制性,可在消费级硬件上运行
Qingmu2024
·
2025-02-03 06:23
AIGC(文本图像视频)特训营
人工智能
python
stable
diffusion
Stable
Diffusion
创始人:DeepSeek没有抄袭!
Datawhale分享观点:EmadMostaque,编译:Datawhale视频中英对照如下:Distillationisnothingnew,andthere'snowaytokindofstopthisfromthemodelbasis.蒸馏技术并不是什么新事物,而且从模型的角度来看,没有办法完全阻止这种情况的发生。Butifyouactuallylookatwhatthepapersays
Datawhale
·
2025-02-03 06:51
stable
diffusion
人工智能
【 书生·浦语大模型实战营】学习笔记(三):“茴香豆” 搭建你的RAG 智能助理
学习星球推荐:GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于前沿
论文解读
GoAI
·
2025-02-03 05:10
自然语言处理NLP
深入浅出AI
深入浅出LLM
深度学习
LLM
人工智能
大模型
Fooocus AI绘画神器兼具Midjourney和Stable
Diffusion
强大功能,win版本整合包一键运行N卡版(8g内存4g显卡可操作硬盘空间要500g),省去繁琐的安装(A卡改参数)
开源AI绘画工具Fooocus使用指南最近,在Github上一款全新的开源AI绘画工具Fooocus横空出世,引发了众多AI绘画爱好者的关注。它不仅能够像StablediffusionWebUI一样部署到本地免费使用,还具备midjourney那般便捷的操作界面,为用户带来了极其出色的创作体验。Foocus重新思考了图像生成器的设计。该软件是离线的,开源的,免费的,同时,类似于许多在线图像生成器,
struggle2025
·
2025-02-02 15:30
AI作画
midjourney
stable
diffusion
人工智能
计算机视觉
图像处理
【AI日记】25.01.25
【AI
论文解读
】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AIkaggle比赛:ForecastingStickerSales读书书名:法治的细节律己AI:8小时,良作息:00
AI完全体
·
2025-02-01 23:42
AI日记
人工智能
kaggle
比赛
机器学习
读书
【AI知识点】三种不同架构的大语言模型(LLMs)的区别
【AI
论文解读
】【AI知识点】【AI小项目】【AI战略思考】在自然语言处理(NLP)中,预训练语言模型(LLMs,LargeLanguageModels)通常基于不同的架构,如仅编码器的模型(Encoder-only
AI完全体
·
2025-02-01 23:09
AI知识点
人工智能
语言模型
自然语言处理
机器学习
深度学习
注意力机制
自注意力机制
LoongServe
论文解读
:prefill/decode分离、弹性并行、零KV Cache迁移
LoongServe
论文解读
:prefill/decode分离、弹性并行、零KVCache迁移LoongServe:EfficientlyServingLong-contextLargeLanguageModelswithElasticSequenceParallelism
04290629
·
2025-01-30 18:13
LLM笔记
transformer
人工智能
算法
深度学习
【 书生·浦语大模型实战营】学习笔记(五):LMDeploy 量化部署
学习星球推荐:GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于前沿
论文解读
GoAI
·
2025-01-30 03:18
深入浅出LLM
深入浅出AI
大模型
LLM
部署
人工智能
LMDeploy
GPTHUB
支持一键切换ChatGPT(3.5、4.0)模型、月之暗面(Kimi)、文心一言(支持Stable-
Diffusion
-XL作图)、通义千问、讯飞星火、智谱清言(ChatGLM)等主流模型,后续模型持续对接中
@小马哥
·
2025-01-29 13:24
AI
chatgpt
文心一言
Qwen-VL
论文解读
Qwen-VL:用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中,我们介绍了Qwen-VL系列,这是一组大规模的视觉-语言模型(LVLMs),旨在感知和理解文本和图像。从Qwen-LM开始,我们通过精心设计的(i)视觉受体,(ii)输入-输出接口,(iii)3阶段训练管道,以及(iv)多语言多模态清洗语料库,赋予其视觉能力。除了传统的图像描述和问答,我们还通过图像-标题-框元组的对齐实现
dream_home8407
·
2025-01-29 09:10
人工智能
CT-Mamba:一种用于低剂量CT降噪的混合卷积状态空间模型
论文解读
论文:CT-Mamba:AHybridConvolutionalStateSpaceModelforLow-DoseCTDenoising代码:zy2219105/CT-Mamba,作者称将会在论文正式发表后提供。本文参考了该网站,其对CT-Mamba提供了更详细的描述:https://www.aimodels.fyi/papers/arxiv/ct-mamba-hybrid-convolutio
ZcZc__1
·
2025-01-28 17:52
深度学习
人工智能
图像处理
AI大模型DreamShaper XL v2系列分享,适用于Stable
Diffusion
和ComfyUI
DreamShaperXLv2TurboDPMpp_v2Turbo通过百度网盘分享的文件:DreamShaperXLv2TurboDPMpp_v2TurboDPMpp.safetensors链接:https://pan.baidu.com/s/1ja-9GrFPy7enGKAO-cUUFQ?pwd=5566提取码:5566–StableDiffusion放在models\Stable-diffus
szboy2003
·
2025-01-28 13:52
人工智能
stable
diffusion
AI作画
图像处理
python
视觉检测
手撕
Diffusion
系列 - 第八期(end) -
Diffusion
推理
手撕
Diffusion
系列-第八期(end)-
Diffusion
推理目录手撕
Diffusion
系列-第八期(end)-
Diffusion
推理DDPM原理图DDPM反向去噪
DIffusion
推理代码Part1
小菜鸟博士
·
2025-01-28 13:52
手撕Diffusion
深度学习
人工智能
算法
面试
学习
开放传神(OpenCSG)手撕Sora的
Diffusion
Transformer (DiT)算法
“Sora的出现不是偶然,而是经过长期积累、反复试错及用户反馈的必然。”OpenAI尝试过递归网络、生成对抗网络、自回归Transformer及扩散模型。最终诞生了DiffusionTransformer。其充分利用了大语言模型Token的好处,让像素也能够被预测(Patches)。Sora的诞生不亚于2023年ChatGPT的出现,因为我们的世界是一个五彩斑斓的图像和视频组成。Sora通过社区和
OpenCSG
·
2025-01-28 13:20
transformer
算法
深度学习
人工智能
stable
diffusion
深入浅出解析Stable
Diffusion
中U-Net网络
题解|#数组中出现次数超过一半的数字#importjava.util.*;publicclassSolution{/***代码中的类名、方法名、参数名已经指定,请勿修改,24秋招腾讯QQ浏览器提前批一面一面(35分钟)先做个自我介绍你应该学过操作系统和计算机网络进程和线程UDP和TCP的区别UDP和TCP如何实现拥塞控制什么情况下用UDP,什么情况下用TCP题解|#牛牛学说话之-浮点数##incl
2301_78234743
·
2025-01-28 12:49
java
Stable
Diffusion
:Python图像生成实战指南
前言今天要跟大家分享一个特别有趣的话题-如何使用Python和StableDiffusion来生成AI艺术作品。作为一名Python爱好者,我特别喜欢探索AI领域的新技术,而StableDiffusion则是最近特别火热的AI图像生成工具之一。1.StableDiffusion简介与环境配置StableDiffusion是一个强大的AI图像生成模型,它能够根据文字描述生成高质量的图像。在开始实战之
AI绘画咪酱
·
2025-01-28 03:44
stable
diffusion
python
人工智能
AI作画
AIGC
ai
ViT
论文解读
ViT
论文解读
本文主要记录YiZhu大佬对于ICLR2021的一篇论文精读ANIMAGEISWORTH16x16WORDS:TRANSFORMERSFORIMAGERECOGNITIONATSCALE论文地址
freshfish丶
·
2025-01-27 18:35
文献阅读
深度学习
计算机视觉
transformer
[论文精读]Understanding
Diffusion
Models: A Unified Perspective
发布链接:http://arxiv.org/abs/2208.11970文章详细讨论了扩散模型(DiffusionModels)作为一种生成模型的工作原理,并从多个角度解释其背后的数学机制。阅读原因:实验需要理解SD的数学建模过程数学层面更好的解释:diffusionmodel(一):DDPM技术小结(denoisingdiffusionprobabilistic)|莫叶何竹1.扩散模型简介扩散模
0x211
·
2025-01-27 16:26
论文精读
数学建模
基于Stable
Diffusion
3.5 Large模型的微调技术详解
基于StableDiffusion3.5Large模型的微调技术详解引言StableDiffusion3.5Large(以下简称SD3.5)是近年来在生成式AI领域备受关注的一个模型,尤其在图像生成任务中表现出色。它基于扩散模型(DiffusionModel)的架构,能够生成高质量的图像,并且在文本到图像(Text-to-Image)任务中展现了强大的能力。然而,尽管SD3.5在通用图像生成任务中
zhangjiaofa
·
2025-01-27 08:28
大模型
图像生成
模型微调
在亚马逊云科技上用Stable
Diffusion
3.5 Large生成赛博朋克风图片(上)
背景介绍在2024年的亚马逊云科技re:Invent大会上提前预告的StableDiffusion3.5Large,现在已经在AmazonBedrock上线了!各位开发者们现在可以使用该模型,根据文本提示词文生图生成高质量的图片,并且支持多种图片风格生成,助力媒体、游戏、广告和零售等行业的开发者们加速概念艺术、视觉特效以及精修产品宣传图的生成创作。2024年10月,图像生成模型厂商Stabilit
佛州小李哥
·
2025-01-27 06:20
AWS技术
科技
stable
diffusion
人工智能
亚马逊云科技
aws
ai
语言模型
Classifier Guidance 与 Classifier-Free Guidance
ClassifierGuidance与Classifier-FreeGuidanceDDPM终于把
diffusion
模型做work了,但无条件的生成在现实中应用场景不多,我们终归还是要可控的图像生成。
Adenialzz
·
2025-01-26 18:22
stable
diffusion
Diffusion
中guidance_scale 的理解
guidance_scale是一个控制生成图像引导程度的参数。它的含义和使用与论文Imagen:PhotorealisticText-to-ImageDiffusionModelswithComposableConditions中的公式(2)的引导权重类似。1.Classifier-FreeGuidance的背景Classifier-FreeGuidance是一种在扩散模型中提高生成样本质量的方法
不当菜鸡的程序媛
·
2025-01-26 18:50
Diffusion
人工智能
stable
diffusion
【大模型】AutoDL部署AI绘图大模型Stable
Diffusion
使用详解
目录一、前言二、AI绘图大模型概述2.1AI绘图大模型介绍2.2AI绘图大模型特点2.3AI绘图大模型优势三、主流的AI绘图大模型介绍3.1Midjourney3.1.1Midjourney介绍3.1.2Midjourney功能特点3.1.3Midjourney使用场景3.2StableDiffusion3.2.1StableDiffusion介绍3.2.2StableDiffusion特点3.2
小码农叔叔
·
2025-01-25 07:19
AI大模型实战与应用
AutoDL部署AI绘图大模型
AI绘图大模型
AutoDL部署SD
AI绘图大模型SD使用详解
SD使用详解
SD部署
stable
diffusion
webui电商基础模型
电商生成模型的产生主要有两个路子,1.训练微调;2.模型融合。下面这些是借鉴,帮助思考如何构建电商模型。电商必备的10款StablediffusionWebUI模型-知乎一、WFProduct电商场景这是一个专门为电商摄影场景训练的lora模型,可以生成各种极具设计感的场景图,效果逼真,无论是电商、海报、产品渲染还是空间布置上都能用得到,可以解决产品摄影空间布景困难、创意度不…https://zh
Kun Li
·
2025-01-25 05:06
多模态大语言模型
stable
diffusion
stable
diffusion
模型和lora融合
炜哥的AI学习笔记——SuperMerger插件学习-哔哩哔哩接下来学习的插件名字叫做SuperMerger,它的作用正如其名,可以融合大模型或者LoRA,一般来说会结合之前的插件LoRABlockWeight使用,在调整完成LoRA模型的权重后使用改插件进行重新打包。除了LoRA,Checkpoint也可以通过这个插件进行融合合并。实际上,目前市面上存在大量的Checkpoint模型都是经由合并
Kun Li
·
2025-01-25 05:06
图像视频生成大模型
stable
diffusion
入门Stable-
Diffusion
-WebUI全过程
这里用的软件叫“stable-
diffusion
-webui”,严格意义上来说是一个基于StableDiffusion的开源项目。
沙漠蓝色披头
·
2025-01-25 01:03
Ai大模型
stable
diffusion
如何训练Stable
Diffusion
模型
训练StableDiffusion模型是一个复杂且资源密集的过程,通常需要大量的计算资源(如GPU或TPU)和时间。StableDiffusion是一种基于扩散模型的生成式AI,能够根据文本提示生成高质量的图像。它的训练过程涉及多个步骤,包括数据准备、模型配置、训练参数调整等。以下是训练StableDiffusion模型的基本步骤和注意事项:1.环境准备1.1安装依赖项首先,确保你有一个适合深度学
俊偉
·
2025-01-25 00:59
AGI
stable
diffusion
扩散模型
训练
AI炼丹
AAAI2024
论文解读
|Memory-Efficient Reversible Spiking Neural Networks-water-merged
论文标题Memory-EfficientReversibleSpikingNeuralNetworks内存高效可逆脉冲神经网络论文链接Memory-EfficientReversibleSpikingNeuralNetworks论文下载论文作者HongZhang,YuZhang内容简介本文提出了一种可逆脉冲神经网络(RevSNN),旨在降低脉冲神经网络(SNNs)在训练过程中对中间激活和膜电位的内
paixiaoxin
·
2025-01-24 16:22
文献阅读
论文合集
脉冲神经网络
可逆架构
内存效率
深度学习
训练优化
AAAI
自学成才之路,DeepSeek R1
论文解读
DeepSeekR1的论文看完后,后劲很大。虽然我推荐所有人都去阅读一下,但我估计实际去读的人应该很少。今天把论文里的三个亮点,用通俗易懂地方式写出来,希望能让更多人了解这篇论文有多么重要。亮点一:告别“刷题班”,纯“实战”也能练出推理大神!我们平时学习,是不是经常要“刷题”?做大量的练习题,才能巩固知识,提高解题能力。以前训练AI模型,也差不多是这个套路,要先给AI“喂”大量的“习题”(监督数据
智识世界Intelligence
·
2025-01-24 01:24
神经网络
深度学习
自然语言处理
课程设计
学习方法
【AI日记】25.01.22
【AI
论文解读
】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AIkaggle比赛:ForecastingStickerSales读书书名:自由宪章,论美国的民主阅读原因:了解美国的架构设计和底层原理
AI完全体
·
2025-01-23 09:03
AI日记
人工智能
机器学习
kaggle
比赛
读书
全网最全Stable
diffusion
保姆级教程「安装-配置-画图」,小白必收藏!!
随着chatgpt爆火之后,越来越多的人开始关注人工智能,人工智能相关的其他应用如AI绘画,也再次得到人们的关注。AI绘画的确很上头,最近几天小编也研究一下,这里把研究的过程以及中间遇到的问题整理一下,我这里遇到的问题,相信新入门的小白也会遇到,希望本文对你能有一定的帮助。给大家带来了全新保姆级教程资料包(文末可获取)目前常用的AI绘画工具主要有两种:stablediffusion和midjour
AI想象家
·
2025-01-21 15:46
stable
diffusion
AI作画
midjourney
人工智能
深度学习
vid2vid-zero:使用Stable
Diffusion
进行零样本视频编辑
Paper:WangW,JiangY,XieK,etal.Zero-shotvideoeditingusingoff-the-shelfimagediffusionmodels[J].arXivpreprintarXiv:2303.17599,2023.Introduction:UnreleasedCode:https://github.com/baaivision/vid2vid-zero目录一
ScienceLi1125
·
2025-01-21 14:12
3D视觉
stable
diffusion
开源AI图像工具—Stable
Diffusion
StableDiffusion是一种基于深度学习的生成式模型,用于图像生成、图像修复和风格转换等任务。它是由StabilityAI和CompVis团队联合开发的。StableDiffusion在生成高质量图像方面表现出色,并且是开源的,可以自由使用和扩展。StableDiffusion的核心技术1.扩散模型(DiffusionModels):•基于概率生成模型。•从噪声中逐步反向生成清晰的图像。•
蚂蚁在飞-
·
2025-01-21 14:41
人工智能
stable
diffusion
AAAI2024
论文解读
|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心
论文标题TowardsFairerCentroidsink-meansClustering面向更公平的k均值聚类中心论文链接TowardsFairerCentroidsink-meansClustering论文下载论文作者StanleySimoes,DeepakP,MuirisMacCarthaigh内容简介本文提出了一种新的聚类级质心公平性(Cluster-levelCentroidFairne
paixiaoxin
·
2025-01-21 10:10
文献阅读
论文合集
支持向量机
机器学习
人工智能
聚类公平性
k
均值聚类
质心代表性
群体代表性公平性
深入理解AIGC背后的核心算法:GAN、Transformer与
Diffusion
Models
深入理解AIGC背后的核心算法:GAN、Transformer与DiffusionModels前言随着人工智能技术的发展,AIGC(AIGeneratedContent,人工智能生成内容)已经不再是科幻电影中的幻想,而成为了现实生活中的一种新兴力量。无论是自动生成文章、绘制图像、生成音乐还是创作视频,AIGC都在各个内容创作领域崭露头角。然而,这些“智能创作”的背后究竟依赖于哪些算法?今天,我们将
忘梓.
·
2025-01-21 10:36
杂文
AIGC
算法
生成对抗网络
【AI日记】25.01.06
【AI
论文解读
】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AI参加:kaggle比赛ForecastingStickerSales读书书名:国家为什么会失败阅读原因:2024
AI完全体
·
2025-01-21 01:08
AI日记
人工智能
机器学习
kaggle
比赛
Stable
Diffusion
3(SD 3)模型分享
整理了StableDiffusion3(SD3)模型,分享如下:sd3_medium.safetensors链接:https://pan.baidu.com/s/1aYq0MTmKj0U9fBNexV-7sw?pwd=5566提取码:5566sd3_medium_incl_clips_t5xxlfp8.safetensors链接:https://pan.baidu.com/s/1cg3zESBk0
szboy2003
·
2025-01-20 21:01
stable
diffusion
图像处理
视觉检测
AI作画
ACL 2024 | 美团技术团队精选
论文解读
本文精选了美团技术团队被ACL2024收录的4篇论文进行解读,论文内容覆盖了训练成本优化、投机解码、代码生成优化、指令微调(IFT)等技术领域。这些论文是美团技术团队跟高校、科研机构合作的成果。希望能给从事相关研究工作的同学带来一些帮助或启发。ACL是计算语言学和自然语言处理领域最重要的顶级国际会议,由国际计算语言学协会组织,每年举办一次。据谷歌学术计算语言学刊物指标显示,ACL影响力位列第一,是
·
2025-01-18 05:12
美团算法人工智能
让创意在幻觉中肆虐: 认识Illusion
Diffusion
AI
人工智能新境界在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注IllusionDiffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。AI算法的魔力所在IllusionDiffusion的核心是借助先进的AI模型,包括StableDiffusion和ControlNet,来解读用户输入的文本提示,并生成相应的
·
2025-01-18 05:12
程序员
KDD 2024 | 美团技术团队精选
论文解读
& 论文分享会预告
ACMSIGKDD(KnowledgeDiscoveryandDataMining,简称KDD)是数据挖掘领域的国际顶级会议。KDDCup比赛是由SIGKDD主办的数据挖掘研究领域的国际顶级赛事,从1997年开始,每年举办一次,是目前数据挖掘领域最有影响力的赛事。本文精选了美团技术团队被KDD2024收录的5篇长文进行解读,覆盖了用户意图感知、机器学习&运筹优化、在线控制实验、联合广告模型、实时调
·
2025-01-17 19:29
美团机器学习深度学习
VLM 系列——Qwen2 VL——
论文解读
——前瞻(源码解读)
一、概述1、是什么是一系列多模态大型语言模型(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器+LLM形式(可以认为没有任何投射层)。比较创新的是图像缩放方式+3DLLM位置编码+(预估后面的训练方式也不太一样)。能够处理包括文本、图像在内的多种数据类型,具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解(代码编写和debug论文暂时
TigerZ*
·
2025-01-16 18:48
AIGC算法
AIGC
人工智能
transformer
计算机视觉
图像处理
【笔记】扩散模型(七):Latent
Diffusion
Models(Stable
Diffusion
)
论文解读
与代码实现
论文链接:High-ResolutionImageSynthesiswithLatentDiffusionModels官方实现:CompVis/latent-
diffusion
、CompVis/stable-
diffusion
LittleNyima
·
2024-09-15 00:42
Diffusion
Models
笔记
stable
diffusion
AIGC
人工智能
Stable
Diffusion
-AI美女模特写真使用InstantID插件(附插件)
ControlNet单元1:上传人脸定位照上传任意一张照片,它的作用是控制最终出图的人物脸部位置。我们可以和第一张图片一样。相关[参数设置如下:控制类型:选择"Instant_ID"预处理器:instant_id_face_keypoints模型:control_instant_id_sdxl控制权重:0.5左右(0.45-0.5)【第四步】图片的生成点击【生成】按钮,我们来看一下最终生成的图片效
快乐星球没有乐
·
2024-09-12 16:08
人工智能
stable
diffusion
美女
midjourney
媒体
音视频
Midjourney和 Stable
Diffusion
,学谁呢?
Midjourney是在线的,可以使用文字制作令人惊叹的AI图片。它与StableDiffusion类似,但也有一些区别。Midjourney只能在互联网上使用,并且需要付费。那么,值得为Midjourney付费吗?它与稳定扩散有何不同?MidjourneyvsStableDiffusion——功能比较您将在本节中找到StableDiffusion和Midjourney之间的详细比较。与Midjo
Ai君臣
·
2024-09-12 14:40
【Vidu发布】中国首个长时长、高一致性、高动态性Video AI大模型
该模型采用生数科技团队原创的
Diffusion
与Transformer融合的架构U-ViT。
叶锦鲤
·
2024-09-12 13:44
人工智能
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他