写点什么

一句话改图!字节豆包通用图像编辑模型 SeedEdit 上线测试

  • 2024-11-11
    北京
  • 本文字数:1362 字

    阅读完需:约 4 分钟

大小:692.66K时长:03:56
一句话改图!字节豆包通用图像编辑模型SeedEdit上线测试

11 月 11 日,字节在豆包大模型团队官网上公布最新通用图像编辑模型 SeedEdit。据悉,SeedEdit 支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。目前,该模型已经在豆包 PC 端及即梦网页端开启测试。

 

用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。例如,用户在生成一张“小狗在草地奔跑”的图片后,可以直接输入“背景换成海边”等指令,获得一张基于原图片的微调图。此外,用户也可以尝试在豆包 PC 或即梦的图像生成功能中自行上传参考图并进行二次加工。


 

据悉,SeedEdit 是国内首个实现产品化的通用图像编辑模型。过往,学术界在文生图和图生图领域已有较多研究,但做好生成图片的指令编辑一直是难题,二次修改很难保证稳定性和生成质量。今年以来,Dalle3、Midjourney 接连推出产品化的生图编辑功能,相较业界此前方案,编辑生成图片的质量大大改善,但仍缺乏对用户编辑指令的精准响应和原图信息保持能力。 

 

字节跳动豆包大模型团队表示,图像编辑任务的关键在于取得“维持原始图像”和“生成新图像”之间的最优平衡,这一理念贯穿了整个模型的设计与优化过程。

 

据介绍,在模型数据生产中, SeedEdit 针对数据稀缺问题,重新设计模型架构,并且采用多模型、多尺度和多标准的数据制造方案很大程度上解决了数据量,数据多样性和数据质量的问题。作为一款专为图像编辑任务设计的模型,SeedEdit 在通用性、可控性、高质量等方面取得了一定突破。

 

此前业界技术主要针对单个专家任务进行优化,比如针对表情、发型、背景的删除或替换,或专门配置工作流进行风格调配,每次出现新的编辑任务均需收集对应数据进行训练开发。而 SeedEdit 作为通用的图像编辑模型,适用各类编辑任务,支持用户脑洞大开的奇思妙想,无需再训练微调即可快捷应用。 它与业界同类方法对比 (如 EMU Edit 和 Ultra Edit),取得显著更优的性能指标。

 

 

HQ-Edit 等基准测评显示:SeedEdit 能理解相对模糊的指令,且执行细致编辑时具有更高的图像保持率和成功率

 

即便在常规任务中,相比专家模型,SeedEdit 也有一定优势。比如,在“抠图”换背景等用户最常用到的图像分割任务中,SeedEdit 编辑生成后的图像风格自然,无“贴图感”;在局部涂抹、编辑、添加和删除元素等任务中,相比手动涂抹编辑, SeedEdit 通过语言指定, 大大节省了用户涂抹的时间,尤其针对裂纹、发丝等相对精细的涂抹区域。

 

 要求图片将草莓替换成柠檬

 

同时,SeedEdit 通过创新的模型架构,多尺度、多规则的数据获取、构造和过滤方案,能更好地理解用户意图并对齐 diffusion 生图模型,极大提高了图像编辑的精准度,并保持了高质量的图片生成效果。


 要求去掉裂纹,让图片变干净

 

基于豆包文生图大模型,目前 SeedEdit 支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit 还将开放多轮复杂编辑的功能。

 

豆包大模型团队表示,现阶段 SeedEdit 对模型生成图片的编辑效果要好于输入真实图片,同时在更复杂和更精细的控制上仍有改进空间。未来,SeedEdit 会在真实图片保真、ID 保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升编辑可用率和用户体验,支持用户更高效地创作有趣的内容。

 

2024-11-11 11:595803

评论

发布
暂无评论
发现更多内容

如何使用通义灵码玩转Docker - AI助手提升开发效率

阿里巴巴云原生

Docker

2025黑神话悟空更新了什么内容 Mac电脑怎么玩黑神话悟空

阿拉灯神丁

mac电脑虚拟机 CrossOver Mac下载 Mac游戏下载 苹果电脑游戏推荐 黑神话悟空

性价比很高的智能工单管理系统推荐:轻帆云工单管理效率翻倍,运营成本直降50%!

云智慧AIOps社区

ITSM ITSM软件 工单管理 AI智能客服

百吋电视,被海信重新发明

脑极体

AI

昆仑万维开源7B和32B最强数学代码推理模型,同规模下性能超越阿里QwQ-32B,对齐DeepSeek-R1

新消费日报

Laravel 使用通义灵码 - AI 辅助开发提升效率

阿里云云效

laravel

通义灵码助力JavaScript开发:快速获取API与智能编码技巧

阿里云云效

JavaScript

区块链ETF类APP的开发流程

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

Dify Agent 驱动轻量级 MCPserver:联动 Zapier 实现智能搜索高效数据流转

汀丶人工智能

agent MCP

区块链ETF类APP的技术难点

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

区块链ETF类APP的上线

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

一文读通黑神话悟空游戏更新速度慢、更新失败的原因和解决方法

阿拉灯神丁

游戏加速 网络优化 更新系统 黑神话悟空

深入研究:京东商品评论API详解

tbapi

京东商品评论接口 京东API 京东评论API 京东商品评论采集

通义灵码助力JavaScript开发:快速获取API与智能编码技巧

阿里巴巴云原生

js

TapData 与 StarRocks 完成兼容性互认证,携手共建实时数据智能生态,联合打造端到端全链路实时数仓解决方案

tapdata

实时数仓 数据集成 StarRocks 实时数据平台 tapdata和starrocks

ASP.NET 使用通义灵码 - AI 辅助开发提升效率

阿里云云效

AI测试革命:当OpenAI砍掉安全测试周期,软件测试人如何破局?

测试人

人工智能

欢迎投稿!Community Over Code Asia 2025 议题征集全面启动!

Apache IoTDB

用Flutter开发小程序并组装App,是否更高效?

xuyinyin

Easysearch S3 备份实战

极限实验室

S3 easysearch

区块链 ETF 类 APP 的主要功能

北京木奇移动技术有限公司

软件外包公司 区块链ETF ETF软件

GitHub封锁?推荐5个国产的Git仓库替代平台

程序员晚枫

GitHub 开源

《Operating System Concepts》阅读笔记:p629-p635

codists

操作系统

Laravel 使用通义灵码 - AI 辅助开发提升效率

阿里巴巴云原生

AI与无人驾驶汽车:如何通过机器学习提升自动驾驶系统的安全性?

天津汇柏科技有限公司

人工智能 无人驾驶 AI人工智能

你以为的安全,真的安全吗?——拟态安全,一场关于认知的博弈

权说安全

网络安全 零信任

香港首届Web3人工智能与RWA产业投融生态对接峰会蓄势待发

TechubNews

区块链 人工智能 AI

北京大风来,带了什么来

AI时代的一滴水

人生修炼

如何使用通义灵码玩转Docker - AI助手提升开发效率

阿里云云效

Docker

深入研究:1688商品详情API详解

tbapi

1688API 1688商品数据采集 1688数据采集 1688商品详情API

ASP.NET 使用通义灵码 - AI 辅助开发提升效率

阿里巴巴云原生

asp.net

一句话改图!字节豆包通用图像编辑模型SeedEdit上线测试_AI&大模型_褚杏娟_InfoQ精选文章