写点什么

千问发布最新图像模型 Qwen-Image-2.0,支持 1K token 超长文字输入和 2K 高分辨率

  • 2026-02-11
    北京
  • 本文字数:816 字

    阅读完需:约 3 分钟

2 月 10 日,阿里巴巴正式发布新一代图像生成及编辑模型 Qwen-Image-2.0。据介绍,Qwen-Image-2.0 集生图和编辑于一体,在 AI Arena 文生图评测中斩获 1029 分,超过 Seedream4.5、Flux2-Max 等模型,仅次于谷歌 Nano Banana Pro 和 GPT Image1.5。

AI Arena 文生图评测中,Qwen-Image-2.0 位居第三

 

Qwen-Image-2.0 支持 1K token 的超长文字输入和 2K 高分辨率,可准确渲染复杂指令,生成专业的 PPT 及信息图;同时,千问新模型拥有极强中文汉字渲染能力,数百字的古文全文几乎都能完全渲染在图片中。

 

Qwen-Image-2.0 在 Qwen-Image 和 Qwen-Image-Edit 两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。

 

Qwen-Image-2.0 生图质感进一步提升,生成的人物、自然、建筑等常用图片更加逼真。在权威评测 AI Arena 中,千问新模型在图像生成中得分 1029,位列第三;在图片编辑中得分 1034,仅次于 Nano Banana Pro。

Qwen-Image-2.0 生图,以瘦金体写诗配图

 

在中文汉字渲染方面,官方表示 Qwen-Image-2.0 不但可以以多种字体准确渲染汉字,而且写得又多又准,效果比 Nano Banana Pro 更优。千问新模型将输入提示词扩展到 1K token,可详尽描述任务,实现更专业的文字渲染,在专业 PPT、高级海报、多格漫画等复杂图片方面有不错表现,比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂 PPT 等。

 

Qwen-Image-2.0 生图,多文字复杂 PPT 一键生成

 

此外,基于 Qwen-Image-2.0 模型,用户可与 AI 协同创作出更丰富、更实用的图片,比如一句话生成宫保鸡丁的做法流程图,杭州两日旅游攻略图,4x6 的多格漫画组图,儿童绘本图,写实风格的电影海报,极为逼真的绿色丛林等等;同时,用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍,真人配字表情包,双人逼真 AI 合影,诗词配图等。

 

Qwen-Image-2.0 编辑图片

 

据了解,阿里云百炼上已开通 API 邀测,开发者也可通过 Qwen Chat 免费体验新模型。