阶跃星辰开源图像编辑模型 Step1X-Edit

近日,阶跃星辰正式发布通用图像编辑模型 Step1X-Edit,并同步开源。该模型具备多模态改图能力,能助力用户完成 11 类高频图像编辑任务,涵盖替换图片文字、人物美化修图、画面风格迁移以及材质变换等,在阶跃 AI App 和网页端(stepfun.com),用户均可免费使用。

阶跃星辰开源图像编辑模型 Step1X-Edit_第1张图片

Step1X-Edit 模型参数量达 19B,融合 7B MLLM 与 12B DiT,实现多模态语言理解与扩散图像生成的深度融合。这种独特架构赋予模型语义精准解析、身份一致性保持、高精度区域级控制能力。为使模型测试契合市场需求,阶跃星辰自研基准测试集 GEdit-Bench,其评测数据源于社区真实编辑请求。经测试,Step1X-Edit 在语义一致性、图像质量与综合得分等指标上,远超现有开源模型,达到开源 SOTA 水平。

这已是近一个月内阶跃星辰推出的第三款多模态模型,此前还发布了图生视频开源模型和多模态推理模型。目前,在阶跃星辰 Step 系列基座模型矩阵中,多模态模型占比达七成。

业内人士指出,图像编辑模型商业潜力巨大,市场上已有多款同类模型,抖音、快手等国内平台也发布了相关模型。在各类图像编辑模型中,Midjourney 美学灵感突出,GPT-4o 偏向创意修改,抖音即梦 3.0 擅长平面设计,快手可图 2.0 注重电影质感。就当前来看,国外的 Midjourney 和国内的即梦盈利能力相对更强。而 Step1X-Edit 的出现,凭借其先进技术和开源特性,有望在图像编辑领域开拓新的局面,为开发者和用户带来更多可能。

你可能感兴趣的:(人工智能,大数据,AIGC,科技,学习)