写点什么

阿里云 AI 绘画创作大模型通义万相亮相,已开启定向邀测

  • 2023-07-08
    北京
  • 本文字数:764 字

    阅读完需:约 3 分钟

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测

7 月 7 日,在 2023 世界人工智能大会上,阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团 CTO 周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。

 


阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测


据介绍,通义万相在语义理解和图片生成上均表现优秀,首批上线 3 大能力:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的 AI 画作;该模型还在业内率先支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。

 

通义万相基于阿里研发的组合式生成模型 Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果,仅需一个模型即可支持多类图像生成类任务能力,该研究成果已在国际 AI 顶会 ICML 2023 上发表。

 

阿里云在现场展示了该模型生成图片的效果,当输入“沉浸在全页灰度涂色的迷人世界中,有一只老虎在曼陀罗宁静的森林中,画面采用线条、笔画”后,系统能迅速生成线条细节丰富的老虎图片,如果继续使用风格迁移功能,还可随意切换图片风格。

 

在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相,在此之后,通义千问、通义听悟等模型和产品相继推出,通义万相的问世意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。目前,阿里云大模型正逐步走向千行百业,已有超过 30 万企业申请测试通义千问,通义听悟累计用户数达到 36 万。

 

“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”周靖人表示。

2023-07-08 16:016072
用户头像
李冬梅 加V:busulishang4668

发布了 1136 篇内容, 共 755.1 次阅读, 收获喜欢 1276 次。

关注

评论

发布
暂无评论
发现更多内容

蚁架构师首推SpringBoot套餐(原理+实战+面试)

小Q

Java 学习 架构 微服务 SpringBoot 2

手把手带你玩转 openEuler | 如何安装 openEuler

openEuler

Linux 开源 操作系统 openEuler

为什么学Go(一)

soolaugust

Go 语言

技术解析 | 云游戏在未来如何实现?

腾讯云音视频

开发 游戏 视频

Java零基础到进阶宝典!从小白到大神,金九银十面试这届斩获23K月薪

Java架构追梦

Java 学习 架构 面试 核心知识点

解释一下==和equals的区别,你以为就这么简单?那你就草率了

小Q

Java 学习 架构 面试 基础

LAXCUS大数据集群操作系统:一个分布式分时共享E级系统软件(一)

陈泽云

人工智能 云计算 大数据 基础设施 国产操作系统

[Go 并发编程实战课]02.Mutex 源代码

Quincy

Go 语言

vidyo在数字化办公中提供了什么便利?

dwqcmo

音视频 集成架构 解决方案 智能硬件

只要十步,你就可以应用表达式树来优化动态调用

newbe36524

C# netcore ASP.NET Core

架构师训练营第四周作业

四夕晖

生态共赢-anyRTC创业扶持计划

anyRTC开发者

ios 音视频 WebRTC RTC 安卓

4年Java经验,备战两月成功拿到美团、京东、字节offer

Java架构之路

Java 程序员 面试 编程语言

教育场景方案升级| 打通业务前后端,少量开发快速上线(一):互动小班

ZEGO即构

在线教育 低代码

惊险的B站Java后端岗面试之旅,复盘面试经历及面试真题

Java架构之路

Java 程序员 面试 编程语言

搞开发,写SQL就够了

棒锤🐮

sql mybatis springboot Web框架 Rocket API

LeetCode题解:145. 二叉树的后序遍历,栈,JavaScript,详细注释

Lee Chen

大前端 LeetCode

1分钟将vscode撸成小霸王

gamedilong

vscode 大前端

2020年第三季度《全国移动App 风险监测评估报告》

InfoQ_11eaedef67e9

App 移动安全 个人隐私安全

【全球案例】ESL 游戏公司如何通过 Jira 定制化解决方案连接全球团队

Atlassian

项目管理 敏捷 Atlassian Jira

spring-boot-route(十五)整合RocketMQ

Java旅途

Java RocketMQ Spring Boot

视频会议的应用

anyRTC开发者

ios 音视频 WebRTC 直播 安卓

WebSocket从入门到精通,半小时就够!

JackJiang

html5 网络编程 websocket 即时通讯

TNFE-Weekly[第七十五周已更新]

莹姐🙈

小程序 大前端 周报

手把手带你玩转 openEuler | 初识 openEuler

openEuler

Linux 开源 操作系统

[Go并发编程实战课]01.Mutex学习笔记

Quincy

Go 语言

月薪60k的Java开发在阿里是什么级别?对技术能力有哪些要求?

Java架构之路

Java 阿里巴巴 程序员 面试 编程语言

详细分析定制企业应用的价格

Philips

敏捷开发 快速开发

java安全编码指南之:锁的双重检测

程序那些事

java安全编码 java安全编码指南 java代码规范 java代码安全

英特尔聚焦全栈量子研究:发布多项重磅量子计算研究成果

E科讯

TensorFlow 篇 | TensorFlow Serving API

Alex

tensorflow keras model serving tensorflow serving api

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测_阿里巴巴_李冬梅_InfoQ精选文章