写点什么

Midjourney 首次推出 V1 AI 视频模型

作者:Daniel Dominguez

  • 2025-06-26
    北京
  • 本文字数:1040 字

    阅读完需:约 3 分钟

大小:507.14K时长:02:53
Midjourney首次推出V1 AI视频模型

Midjourney 发布了其首个视频生成V1模型,这是一个基于 web 的工具,允许用户将静态图像动画化为 5 秒的视频片段。这个新模型标志着该公司向实时开放世界仿真的更广泛愿景迈出了重要一步,这将需要整合图像、视频和 3D 模型来创造动态、互动的环境。

 

V1通过两种选项让用户制作动画图像:一个是自动动画设置,它为基本运动生成运动提示;另一个是手动动画功能,用户可以描述特定的动作和相机移动。该系统旨在处理Midjourney生成的图像以及从外部源上传的图像,为视频创作提供了灵活性。

 

该模型还引入了一种独特的图像动画工作流程。用户可以将图像拖入提示栏并将其标记为起始帧,然后应用运动提示来对它们进行动画处理。V1 包括两种运动设置:低动态,适用于慢速或最小运动的环境场景;高动态,适用于具有主动相机和主体运动的快节奏场景。然而,高动态有时可能导致意外的小故障或错误。

 

与目前市场上的其他 AI 视频生成工具相比,V1 提供了一种独特的方法。与RunwayDeepBrain等更成熟的平台不同,这些平台专注于具有复杂编辑功能和音频集成的高度抛光、预构建的视频资产,V1 在特定美学下优先考虑静态图像的动画,与 Midjourney 的流行图像模型相一致。虽然像Veo 3这样的竞争对手以其实时视频创作、全音频集成和高质量的运动捕捉而闻名,但 V1 坚持使用更简单的视频输出和有限的运动能力,主要关注于图像到视频的转换。

 

Midjourney 的 V1 视频模型的推出在创意社区中引发了兴奋,用户对其惊人的视觉一致性和艺术风格赞不绝口,经常将其与竞争对手进行比较。

 

AI 艺术家Koldo Huici在 X 上评论道:

 

以前在 After Effects 中创建动画需要 3 个小时。现在有了 Midjourney,我 3 分钟就完成了!我来告诉你这有多简单。

 

而 Gen AI 专家Everett World发文称:

 

拥有一个新的视频模型真是太棒了,尤其是因为它是由 Midjourney 制作的——它开辟了新的、意想不到的可能性。一些生成看起来非常自然(动漫看起来很棒!)。尽管它只有 480p,但我认为我们在 AI 视频领域看到了有趣的发展,我很高兴我们可以从这个模型中获得乐趣!

 

Midjourney计划继续发展其视频能力,着眼于在不久的将来实现实时、开放世界模拟。目前,V1 模型仅供 Web 使用,公司正在密切监控使用情况,以确保它可以扩展其基础设施以满足需求。

 

这次发布之前,该公司正面临着持续不断的法律挑战,包括最近迪士尼和环球影业的侵权诉讼。尽管面临这些挑战,Midjourney 专注于扩展其技术,V1 被视为实现公司沉浸式、互动数字环境愿景的重要一步。

 

原文链接:

https://www.infoq.com/news/2025/06/midjourney-v1-video/

2025-06-26 14:007556

评论

发布
暂无评论

并行编程首篇

shun123456789

开发语言 基础知识

淘宝推荐、视频搜索背后的检索技术:阿里达摩院向量检索Proxima核心能力揭秘

Proxima 技术社区

人工智能 大数据 阿里巴巴 搜索 非结构化数据

多线产品作战,奔疲于不确定的路上

boshi

创业 产品策略 七日更

产品经路训练营 -- 第四章作业(一)

Lucas zhou

产品经理训练

2021最新发布拼多多/字节/360/网易/面经总结

比伯

Java 编程 程序员 架构 面试

2021年3月国产数据库排行榜:雏凤声清阿里三连 绝代双骄华为合璧

墨天轮

数据库 腾讯云 阿里云 华为云 TiDB

两会引爆数字经济 银行与科技公司找到合作新赛道

CECBC

数字经济

新思科技网络安全研究中心发现Jetty Web服务器存在漏洞

InfoQ_434670063458

新思科技 Jetty Web

第二章-利益相关方分析

阿珍爱上阿强

利益相关者

Redis 数据结构介绍

一个大红包

七日更 3月日更

装在套子里的人

Dc

一场发生在“田间地头”的数字化变革

CECBC

三农

谷歌大佬回国发展,吊打各大厂面试官!吐血总结大厂面试高频点及笔记解析

Java架构之路

Java 程序员 架构 面试 编程语言

区块链:热追背后需冷静 技术应用要同步

CECBC

区块链

选择IDaaS解决方案的6个技巧

龙归科技

Idaas

【点评必看】这道 Hard 到底难在哪里?大概是难在考察的是违反“人性直觉”的内容吧 ...

宫水三叶的刷题日记

面试 LeetCode 数据结构与算法

黑客之XSS注入练手:XSS Challenges通关指南

BigYoung

黑客 信息安全 XSS

腾讯五面、快手三面已拿offer(Java岗位),分享个人面经

Java架构之路

Java 程序员 架构 面试 编程语言

他喵的,Google大佬的这份LeetCode刷题笔记太强了,提升算法能力必备!

Java架构之路

Java 程序员 架构 面试 编程语言

如果延迟退休势在必行,区块链如何助力“养老助老”?

CECBC

养老

Kubectl Plugin 推荐(二)| 简化操作篇

郭旭东

Kubernetes kubectl kubectl plugin

Python3 * 和 ** 运算符

老王说编程

Python3

场景demo落地 - 视频通话 2.0 ARCall

anyRTC开发者

flutter uni-app android WebRTC RTC

LeetCode题解:125. 验证回文串,翻转数组,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

第五.需求评审与产品发布 (承上启下的作用)

让我思考一会儿

网点数字化也要适老化 浦发银行为老年人跨越“数字鸿沟”制定服务范本

CECBC

数字鸿沟

高盛:机构需求量巨大,比特币年内或有望涨至10万美元

CECBC

比特币

数据库周刊60丨3月国产数据库排行榜出炉;日本银行数据迁移失败致使业务宕机;阿里云RDS PG13发布;亚健康Oracle数据库故障定位;Redis最佳实践;MySQL查询优化……

墨天轮

MySQL 数据库 oracle 运维 postgre

滚雪球学 Python 之 lambda 表达式

梦想橡皮擦

28天写作 3月日更

紫霞仙子:区块链的十二连问

悟空聊架构

Java 比特币 区块链 架构 分布式

Oracle 是如何处理异常的?

xiezhr

oracle 异常处理 3月日更 PLSQL

Midjourney首次推出V1 AI视频模型_AI&大模型_InfoQ精选文章