如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

一句话改图!字节豆包通用图像编辑模型 SeedEdit 上线测试

  • 2024-11-11
    北京
  • 本文字数:1362 字

    阅读完需:约 4 分钟

大小:692.66K时长:03:56
一句话改图!字节豆包通用图像编辑模型SeedEdit上线测试

11 月 11 日,字节在豆包大模型团队官网上公布最新通用图像编辑模型 SeedEdit。据悉,SeedEdit 支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。目前,该模型已经在豆包 PC 端及即梦网页端开启测试。

 

用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。例如,用户在生成一张“小狗在草地奔跑”的图片后,可以直接输入“背景换成海边”等指令,获得一张基于原图片的微调图。此外,用户也可以尝试在豆包 PC 或即梦的图像生成功能中自行上传参考图并进行二次加工。


 

据悉,SeedEdit 是国内首个实现产品化的通用图像编辑模型。过往,学术界在文生图和图生图领域已有较多研究,但做好生成图片的指令编辑一直是难题,二次修改很难保证稳定性和生成质量。今年以来,Dalle3、Midjourney 接连推出产品化的生图编辑功能,相较业界此前方案,编辑生成图片的质量大大改善,但仍缺乏对用户编辑指令的精准响应和原图信息保持能力。 

 

字节跳动豆包大模型团队表示,图像编辑任务的关键在于取得“维持原始图像”和“生成新图像”之间的最优平衡,这一理念贯穿了整个模型的设计与优化过程。

 

据介绍,在模型数据生产中, SeedEdit 针对数据稀缺问题,重新设计模型架构,并且采用多模型、多尺度和多标准的数据制造方案很大程度上解决了数据量,数据多样性和数据质量的问题。作为一款专为图像编辑任务设计的模型,SeedEdit 在通用性、可控性、高质量等方面取得了一定突破。

 

此前业界技术主要针对单个专家任务进行优化,比如针对表情、发型、背景的删除或替换,或专门配置工作流进行风格调配,每次出现新的编辑任务均需收集对应数据进行训练开发。而 SeedEdit 作为通用的图像编辑模型,适用各类编辑任务,支持用户脑洞大开的奇思妙想,无需再训练微调即可快捷应用。 它与业界同类方法对比 (如 EMU Edit 和 Ultra Edit),取得显著更优的性能指标。

 

 

HQ-Edit 等基准测评显示:SeedEdit 能理解相对模糊的指令,且执行细致编辑时具有更高的图像保持率和成功率

 

即便在常规任务中,相比专家模型,SeedEdit 也有一定优势。比如,在“抠图”换背景等用户最常用到的图像分割任务中,SeedEdit 编辑生成后的图像风格自然,无“贴图感”;在局部涂抹、编辑、添加和删除元素等任务中,相比手动涂抹编辑, SeedEdit 通过语言指定, 大大节省了用户涂抹的时间,尤其针对裂纹、发丝等相对精细的涂抹区域。

 

 要求图片将草莓替换成柠檬

 

同时,SeedEdit 通过创新的模型架构,多尺度、多规则的数据获取、构造和过滤方案,能更好地理解用户意图并对齐 diffusion 生图模型,极大提高了图像编辑的精准度,并保持了高质量的图片生成效果。


 要求去掉裂纹,让图片变干净

 

基于豆包文生图大模型,目前 SeedEdit 支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit 还将开放多轮复杂编辑的功能。

 

豆包大模型团队表示,现阶段 SeedEdit 对模型生成图片的编辑效果要好于输入真实图片,同时在更复杂和更精细的控制上仍有改进空间。未来,SeedEdit 会在真实图片保真、ID 保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升编辑可用率和用户体验,支持用户更高效地创作有趣的内容。

 

2024-11-11 11:596488

评论

发布
暂无评论
发现更多内容

ComfyUI现已上线Neolink.AI,AI 绘画从此轻松驾驭!

MatrixOrigin

GPU算力 AI绘画

Mac动作冒险游戏:侠盗猎车手:罪恶都市 for Mac 下载

你的猪会飞吗

Mac游戏下载 Mac游戏推荐 mac破解软件下载

第三届OpenHarmony技术大会编译器与编程语言分论坛成功

科技热闻

拍立淘API返回值中的商品列表与详细信息解析

技术冰糖葫芦

API 接口 API 文档 API 测试 API 性能测试

【MM2024】面向 StableDiffusion 的多目标图像编辑算法 VICTORIA

阿里云大数据AI技术

人工智能 算法 论文 图像编辑 MM2024

Microsoft Office 2019永久破解补丁 Mac/win

Rose

万亿狂奔背后的券商IT:重度量、做提效、稳扎稳打不要飘

思码逸研发效能

研发效能 金融科技 券商 效能度量 研发效能度量

跨境1688代采案例:探索提供1688代采集运系统的公司

代码忍者

pinduoduo API API 性能测试

第三届OpenHarmony技术大会教育与人才分论坛圆满举办

科技热闻

Navicat Premium:数据库全能管家,管理无忧!

Rose

MatrixOne助力江铜集团打造炉前智慧作业AIoT大数据系统

MatrixOrigin

大数据 AIOT

使用 Rust(替代 C 语言)扩展 NGINX

NGINX开源社区

读书笔记 rust 编程语言

第三届OpenHarmony技术大会OS原生智能分论坛圆满举办

科技热闻

第三届 OpenHarmony 技术大会:创新成果丰硕,共筑开源生态新未来

科技热闻

Sketch快捷键大全 附Sketch最新中文激活安装包

Rose

Adobe Creative Cloud 创意应用软件 可解决adobe安装过程中的大部分问题

Rose

强大的局域网远程播放 nPlayer for Mac v1.4.0中文激活版

Rose

《使用Gin框架构建分布式应用》阅读笔记:p32-p51

codists

gin 编程人

EMQX Platform 旗舰版:面向企业级 AI 和物联网应用的高级 MQTT 消息服务

新消费日报

淘宝API关键词搜索商品列表:优化商家数据分析与策略制定

代码忍者

pinduoduo API API 性能测试

AlDente Pro:苹果电脑电池寿命延长工具

Rose

Final Cut Pro:视频剪辑新纪元,创意无限!

Rose

adobe ai 2021功能介绍 及破解安装教程(Mac/win)

Rose

哪里有Axure RP 10激活码? Axure RP 10 for mac永久授权码分享

Rose

免费BT资源下载利器 BitComet(比特彗星)

Rose

一句话改图!字节豆包通用图像编辑模型SeedEdit上线测试_AI&大模型_褚杏娟_InfoQ精选文章