写点什么

生成式 AI 最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

  • 2024-02-16
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:448.50K时长:02:33
生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

2 月 16 日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。

 

Sora 在日语中意为天空,该技术背后的团队包括 Tim Brooks 和 Bill Peebles,之所以选择这个名字,是希望它能激起无限的创造潜力。


 

OpenAI 给出了不少令人印象深刻的例子:在龙年春节里的舞龙活动,人山人海的场景真假难辨,甚至还有群众拿着手机跟拍的细节;动物世界中,站在树上、戴着王冠的猴子等;在社交媒体上教大家做曲奇的老奶奶;戴着耳机听音乐的两只金毛狗.....




有网友评论说,AI 能根据文字生成图片的时候,他就在想离生成视频的日期不远了,没想到这么快!“又有一波‘固执的’从业者和艺术家们要失业了,从业者门槛进一步拉低!YouTube/TikTok 等一众长视频或短视频网站估计要迎来一波新的流量。”

 

一些 YouTube 网红确实开始担心,MrBeast 发帖半开玩笑地求奥特曼不要让他失业。


 

有投资者则发表评论说,他们早就认为“内容生成干不过大公司,初创公司要做产品和应用……”他们一直认为 Pika 应该转型……

 

而 OpenAI 员工 will depue 则表示,他们过去两个月一直忙于此事,目前 Sora 还处于早期宣传阶段。根据 OpenAI 随后发布的论文来看,这个模型的能力确实已经超出了 OpenAI 最初所宣传的。


 

这篇论文揭示了 Sora 架构的一些关键方面,比如它可以生成任意分辨率和宽高比的视频(最高 1080p)。根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。


将 DALL·E 2 或 DALL·E 3 生成的图片转为视频

 

然而,最令人感兴趣的是 Sora“模拟数字世界”的能力。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频(或交互式 3D 世界,视情况而定)。正如 Nvidia 高级研究员 Jim Fan 所评论的那样,Sora 更像是一个“数据驱动的物理引擎”,而不是一个创意引擎。

 

对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。


例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

 

现在,Sora 正面向部分成员开放,以评估关键领域的潜在危害或风险。

2024-02-16 12:4410784

评论 1 条评论

发布
用户头像
666,视频要被AI攻占了
2024-02-19 13:57 · 北京
回复
没有更多了
发现更多内容

Why Spring ???

猴哥一一 cium

Java spring 源码 Spring Boot 框架设计

MySQL InnoDB 存储引擎 - 锁

Axe

极客大学架构师训练营 系统架构 第7课 听课总结

John(易筋)

极客时间 系统架构 高并发 极客大学 极客大学架构师训练营

架构师训练营第三周命题作业

lwy

极客大学架构师训练营

架构师训练营第三周学习总结

lwy

创业一定要学投资

Neco.W

创业 投资

2020年6月26日 查询性能优化

瑞克与莫迪

从0开始设计Flutter独立APP | 第一篇: 数据库与状态管理

渔子长

flutter 大前端 跨平台

辟谣:程序员不配谈恋爱?你错的可以!真相来了

码农神说

程序员 漫画 相亲

架构师训练营第四周-总结

无心水

极客大学架构师训练营

架构师第4周

上山砍柴

极客大学架构师训练营

区块链系列教程之:比特币中的挖矿

程序那些事

比特币 区块链 挖矿

测试阶段发现缺陷多怎么办?

洪永潮

ARTS week3

姜海天

为什么哈希表可以管理亿级数据?

八两

php redis hash rehash

极客大学架构师训练营 框架开发 模式与重构 JUnit、Spring、Hive核心源码解析 第6课

John(易筋)

spring 极客时间 极客大学 极客大学架构师训练营 JUnit

基于阿里云服务网格(ASM)的GRPC服务部署实践

韩陆

Kubernetes gRPC Service Mesh

抖音、腾讯、阿里、美团春招服务端开发岗位硬核面试(完结)

aoho

面试 后端 阿里

新手村:Redis基础补充知识

多选参数

数据库 redis 数据库设计 redis6.0.0

区块链的应用为什么这么难?出路在哪?

CECBC

比特币 区块链技术 Token 联盟共识

ARTS WEEK4

紫枫

ARTS 打卡计划

WPF中的Data Binding调试指南

大白技术控

.net 微软 WPF

​外包公司干了不到3个月,我离职了...(防坑指南)

程序员生活志

程序员 外包 工作经历

Docker基础修炼2--Docker镜像原理及常用命令

黑马腾云

Docker Linux 容器 运维 镜像

近两年流行面试题:Spring循环依赖问题

Java小咖秀

spring 面试 ioc

【总结】企业级案例驱动 打造高可用、高并发、多IDC部署业务中台微服务架构

魔曦

极客大学架构师训练营

过早优化是万恶之源

非著名程序员

程序员 程序人生 提升认知

二叉树深度优先遍历

封不羁

Java 算法 二叉树

架构训练营第四周 - 作业

无心水

极客大学架构师训练营

[译]都0202年了,你还觉得go-scheduler很难理解吗?

卓丁

golang scheduler GPM goroutines Go 语言

面试官:我们来聊下锁吧

root

Java 乐观锁 悲观锁

生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业_生成式 AI_Tina_InfoQ精选文章