2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

超越 Sora!阿里万相大模型正式开源,消费级显卡也能跑

  • 2025-02-27
    北京
  • 本文字数:1239 字

    阅读完需:约 4 分钟

大小:642.67K时长:03:39
超越Sora!阿里万相大模型正式开源,消费级显卡也能跑

2 月 25 日消息,阿里云旗下视觉生成基座模型万相 2.1(Wan)重磅开源,此次开源采用最宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在 Github、HuggingFace 和魔搭社区下载体验。

 

开源地址:

Github: https://github.com/Wan-Video

HuggingFace: https://huggingface.co/Wan-AI

魔搭社区:https://modelscope.cn/organization/Wan-AI



据介绍,14B 万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集 VBench 中,万相 2.1 以总分 86.22%的成绩大幅超越 Sora、Luma、Pika 等国内外模型,稳居榜首位置。1.3B 版本测试结果不仅超过了更大尺寸的开源模型,甚至还接近部分闭源模型,同时能在消费级显卡运行,仅需 8.2GB 显存就可以生成高质量视频,适用于二次模型开发和学术研究。

 


在算法设计上,万相基于主流 DiT 架构和线性噪声轨迹 Flow Matching 范式,研发了高效的因果 3D VAE、可扩展的预训练策略等。以 3D VAE 为例,为了高效支持任意长度视频的编码和解码,万相在 3D VAE 的因果卷积模块中实现了特征缓存机制,从而代替直接对长视频端到端的编解码过程,实现了无限长 1080P 视频的高效编解码。此外,通过将空间降采样压缩提前,在不损失性能的情况下进一步减少了 29%的推理时内存占用。

 

万相团队的实验结果显示,在运动质量、视觉质量、风格和多目标等 14 个主要维度和 26 个子维度测试中,万相均达到了业界领先表现,并且斩获 5 项第一。尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。

 


(万相在 14 个主要维度测试中斩获 5 项第一及平均分第一)

 

从 2023 年开始,阿里云就坚定大模型开源路线,其千问(Qwen)衍生模型数量已超过 10 万个,是全球最大的 AI 模型家族。随着万相的开源,阿里云实现了全模态、全尺寸大模型的开源。 

生成效果如何


下面我们可以看下万相 2.1 的实际生成效果。

 

输入 Prompt:

体育摄影风格,骑手在场地障碍赛中引导马匹快速通过障碍物。骑手身着专业比赛服,头戴安全帽,表情专注而坚定,双手紧握缰绳,双腿夹紧马腹,与马匹完美配合。马匹腾空跃起,动作连贯且准确,四蹄有力地踏过每一个障碍物,保持速度和平衡。背景是自然的草地和蓝天,画面充满动感和紧张感。4K, 高清画质, 动作完整。

 

生成图片:



输入 Prompt:

体育摄影风格,中国皮划艇运动员在激流回旋比赛中,于湍急的水流中用桨快速划水,灵活地绕过一个又一个障碍物。他身着专业运动服,肌肉线条明显,表情专注而坚定,展现出出色的操控技术和顽强的拼搏精神。背景是清澈的河流和翠绿的山峦,画面充满动感与活力。近景特写,运动员在空中翻转滑板,动作完整,4K, 高清画质。


生成图片:



输入 Prompt:

一段超速 POV 镜头,摄像机疾驰穿越一条阳光下的中国乡村小路,镜头紧跟着一个在空中飞行的穿着休闲服休闲鞋的中国女子的背后,她身体直立展开双臂,风吹动她的头发和衣服。


生成图片:



2025-02-27 12:5410465

评论 5 条评论

发布
用户头像
666666
2025-02-27 14:33 · 福建
回复
用户头像
111111
2025-02-27 14:02 · 广东
回复
1111
2025-02-27 14:02 · 广东
回复
11111
2025-02-27 14:09 · 广东
回复
11111111
2025-02-27 14:09 · 广东
回复
没有更多了

智能指标AIMetrics赋能:构建一体化数据智能决策中枢

袋鼠云数栈

数据 数据治理 大数据平台 数据管理 数据库 大数据

DApp 开发:开启去中心化应用新时代

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

用 AI “一句话生成代码”,用创意兑换灵码潮品:技术人的夏日狂欢季来了

阿里巴巴云原生

通义灵码

从SQL Server到分布式大数据平台:重构企业数据架构

袋鼠云数栈

数据库 sql 数字化转型 数据治理 SQL Server

华商律所与iCourt达成战略合作,国内首家千人规模强所完成AI本地化部署

科技汇

AI 应用开发(二):Blender 建模助手

北桥苏

人工智能 大模型 AI智能体 AI工作流 MCP协议

Sermant指标采集功能:构建指标可观测性实践

华为云开源

开源 微服务架构 sermant

筑牢数据防线!企业级数据安全管控的核心功能全解析

袋鼠云数栈

数据库 大数据 数据治理 企业数据库

通义灵码2.5来袭!MCP 功能直接让开发效率提升300%(附实战案例)

阿里云云效

阿里云 通义灵码

国产化方案如何破解数据迁移困局?

袋鼠云数栈

数据架构 数据治理 大数据平台 数据迁移 数据管理

商品中心—库存分桶调配的技术文档

不在线第一只蜗牛

Java spring

用友成功中标茅台集团司库数据管理项目

用友BIP

数智焕新 “数质”先行 用友BIP为企业补上数据这一课

用友BIP

用友与柳钢再续合作新篇,共筑废钢产业数智化新标杆

用友BIP

真正好用的企业AI:生于“原生”,成于“一体”

用友BIP

从“工具逻辑”到“体系逻辑”,企业治理为何必须跨越传统BI走向指标驱动?

袋鼠云数栈

数据库 数字化转型 BI 数据可视化 数据管理

快速理解向量和向量数据库

量贩潮汐·WholesaleTide

数据库

现代 Web 安全实践:基于 Token 与 Refresh Token 的单点登录 (SSO) 实现

袋鼠云数栈

Web 数字化转型 解决方案 数据管理 单点登录

Python Flask 容器化应用链路可观测

观测云

Python

链游开发:在区块链浪潮中构建虚拟世界

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

公链钱包开发:打造安全便捷的数字资产管家

区块链软件开发推广运营

交易所开发 链游开发 公链开发 代币开发 链游开发公链开发

昇腾CANN再进化:开放创新繁荣AI生态

极客天地

稳定币是对 Pi 网络的威胁吗?

TechubNews

通义灵码2.5来袭!MCP 功能直接让开发效率提升300%(附实战案例)

阿里巴巴云原生

阿里云 通义灵码

数据任务调度解决离不开离线开发BatchWorks

袋鼠云数栈

数据库 数据治理 数据调度 数据资源 batchworks

AI已经很聪明了,为什么我们还需要“ AI Agent 平台”?

袋鼠云数栈

数据平台 AI大模型 AI应用 数据化转型 AI Agent

新时代智慧工地如何重塑班会

袋鼠云数栈

数字化转型 数据治理 数据安全 数据服务 数字化治理

Aliyun OSS iOS SDK 使用指南

qife122

ios 阿里云

AI Infra 运维实践:DeepSeek 部署运维中的软硬结合

袋鼠云数栈

数据库 大数据 运维 数据治理 数据平台

当空间与数据联动,会展中心如何打造智慧运营新范式?

袋鼠云数栈

数据治理 数据运营 可视化数据 现代产业 数据智慧运营

用 AI “一句话生成代码”,用创意兑换灵码潮品:技术人的夏日狂欢季来了

阿里云云效

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑_AI&大模型_褚杏娟_InfoQ精选文章