智能体刷屏的背后,是 AI 应用拐点的来临?AICon 北京站议程重磅公布,50+ 硬核分享不容错过 了解详情
写点什么

Sora 刚正式登场就把 OpenAI 系统干废了!Altman 紧急暂停新用户注册

  • 2024-12-10
    北京
  • 本文字数:2599 字

    阅读完需:约 9 分钟

大小:1.25M时长:07:17
Sora 刚正式登场就把OpenAI系统干废了!Altman紧急暂停新用户注册

无论是可以做多模态推理的满血版 o1(给少数人准备的 200 美元 / 月 ChatGPT 大会员),还是少量数据就可以通过极少量高质量示例就可以快速调整模型的强化微调功能,OpenAI 12 天活动的前两天都让网友们直呼不过瘾和些许失望。


在提前一天就开始造势后,OpenAI 终于迎来了令 Altman“非常兴奋”的第三天。这次 Altman 毫不犹豫地确认 Sora 已经到来。Sora 今天起将在美国和“大多数国家”推出,并将在 Sora.com 上为 ChatGPT Plus 用户和 ChatGPT Pro 用户提供服务。此外,Sora Turbo 将于今天推出,具有更多功能,包括更快的处理器时间。



截图来自:Sora.com


此次发布的 Sora 版本,能够生成包含多个角色、特定类型动作以及主题和背景准确细节的复杂场景。该模型不仅理解用户在提示中所请求的内容,还理解这些事物在现实物理世界中的存在方式。


此外,OpenAI 还发布了 Sora 视频编辑器( Sora Video Editor),可以生成长达 20 秒的视频,同时保持视觉质量并符合提示词要求。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    用户可以在屏幕底部通过在输入字段中提供文本来描述视频,或者在初始提示中上传图片或视频文件。如果要上传图片或视频文件,需要在输入字段中选择 + 选项,然后上传。根据上传条款协议,用户不得上传任何非自己所有或不拥有所有必要权利的内容,并且未经他人明确书面同意,用户不得上传任何他人的图像或视频。



    提交提示词后,Sora 可能需要一分钟才能生成视频,此前用户可以查看设置,更改宽高比、分辨率、持续时间以及要创建的变体数量,不过更改这些设置将影响用户在生成上花费的积分。


    视频生成完成后,用户可以将鼠标悬停在库中的预览上,观看所有视频的播放,以比较结果。用户可以点击单个视频以便在更大的视图中查看、编辑和构建生成的视频,Sora 视频编辑器包括以下功能:


    Re-cut,在新的 Storyboard 中修剪、延长视频。Remix ,描述更改并基于此生成新的视频。Blend,从一个视频和另一个视频中的过渡元素 Loop,根据视频的任何部分创建无缝循环


    其中,Storyboard 可以让用户通过按时间戳选择要在视频中生成的单个帧来创建视频。



    OpenAI 展示了 Sora 的 Remix 功能,将猛犸象换成了机器人,效果确实不俗。不过它不像第一代那样可以瞬间完成,需要几分钟时间。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      用户还可以将视频添加到特定文件夹、举报视频或删除视频,但是已删除的内容是无法恢复的。


      系统都挤爆了


      Sora 研究副总裁 Aditya Ramesh 在 x 上也展示了新的视频:


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        OpenAI 前 CTO Mira Murati 也前来恭喜。



        OpenAI 研究员 Will DePue 在 x 上表示,“我们付出了巨大的努力才实现这一目标,我认为该产品非常有趣且直观。”他表示自己最喜欢做的事情是生成虚假的历史镜头,他展示的视频也是此类:


        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          发布后,就有用户迫不及待尝试。ChatGPT Plus 用户 Lance Ulanoff 在提示字段中输入,请求生成一个中年男子在海边建造火箭的场景。他描述了一个宁静的场景,有月亮、海浪轻拍、篝火和一只友好的狗。默认设置:5 秒、480p。


          根据他的描述,只花了大约一分钟的时间,就出现了两个视频选项。一个是 5 秒钟的视频片段,里面有一只狗,但它的尾巴长在了头上。另一个 5 秒的视频不仅狗是正确的,也展示了一个男人正在建造一个小火箭模型。



          “我想我不是唯一一个想使用 Sora 的人。截至目前,该系统已满负荷,尽管 Sora 界面中的某些功能(如 Storyboard )仍可工作,但由于系统已满负荷,它无法生成任何新的 AI 视频。事情可能需要一段时间才能平息下来——毕竟这是第一天——但当平息下来时,你会想尝试一下 Sora,相信我。”Ulanoff 说道。



          不久后,Altman 就在 X 上发帖称,由于需求高于预期,他们暂停了视频生成器 Sora 的新注册,并且视频生成速度暂时会变慢。



          当然,由于效果过于逼真,有的网友也会有些忧虑,“有点担心小孩子看这些视频可能会对自然界的物理现象产生不准确的印象。例如那只瓢虫看起来非常自然,但其中有一个小瑕疵,一个从未见过瓢虫移动的不知情的观察者可能会误以为这是正常的。”


          使用有限制:账户、积分


          Sora 目前只对 ChatGPT Plus 和 ChatGPT Pro 用户开放,ChatGPT Free、Enterprise 和 Edu 账户无法访问 Sora。


          其中,ChatGPT Plus 用户最多 50 个优先视频(消耗 1,000 积分),视频分辨率高达 720p,时长为 5 秒;ChatGPT Pro 用户则最多 500 个优先视频(消耗 10,000 积分),可以生成无限 relaxed 视频(不消耗积分,但可能被安排在网站流量低时排队完成),最高支持 1080p 分辨率、20 秒时长、同时可以生成 5 个视频,并且下载无水印。


          需要注意的是,通过 Sora 制作视频需要积分。不同分辨率、不同时长需要消耗的积分也不相同。一次请求生成多个视频将按与运行两个单独的生成请求相同的费率收费。



          如果使用 Re-cut、Remix、Blend 和 Loop 来创建超出 5 秒增量的内容,则积分将按以下方式消耗:



          另外,截至目前,OpenAI 尚不清楚何时在欧洲和英国推出。


          Sora 支持的国家列表:


          https://help.openai.com/en/articles/10250692-sora-supported-countries


          需要注意的是,OpenAI 会选择使用用户数据进行模型训练。如果想要禁止将个人数据用于模型训练,可以在个人资料中选择“设置”> “数据控制”,然后禁用“为每个人改进模型”功能。



          结束语


          或许是因为 Sora 一直未正式发布,但大家对其呈现的效果都很惊叹,因此 Sora 一直备受关注和期待。


          昨天,LontVideo 联合创始人 CEO Ruud van der Linden 还在 x 上透露,OpenAI 的 Chad Nelson 在伦敦的 C21Media 主题演讲中表示 Sora v2 即将发布。根据泄露的视频内容,Sora v2 能够生成长达一分钟的动态视频,支持文本生成视频(text-to-video)、图像生成视频(text+image-to-video)、视频编辑生成(text+video-to-video)、视频间转换(video-to-video)。不过这次发布并未如提及的这般。


          Sora 在上月底还被人在 huggingface 上恶意泄露了 API,使其短暂的开放了 1 小时左右。原因则是获得早期访问权限、测试 Sora 的艺术家和 OpenAI 爆发了巨大矛盾。他们认为,OpenAI 利用其进行免费工作,通过过分控制其早期测试计划,让他们白白为 OpenAI 制作宣传视频,于是这群艺术家通过泄露了 OpenAI 的 Sora 视频生成器访问权限,表达了对 OpenAI 的不满。


          根据当时泄露的信息,这版 Sora 可以生成最高 1080P 分辨率、时长 10 秒的视频。有网友在使用 Sora 的 API 时候发现,泄露的 API 实际上是 Sora Trubo。但 OpenAI 发言人回应只表示,Sora 仍处于“研究预览”阶段。


          此次 Sora 终于如愿发布,是否满足了大家的期待?


          2024-12-10 17:007271

          评论 1 条评论

          发布
          用户头像
          满足欲望的新方式
          2024-12-18 13:44 · 浙江
          回复
          没有更多了
          发现更多内容

          花火交易所APP软件系统开发(现成)

          系统开发

          架构师训练营第 1 期第 11 周总结

          owl

          极客大学架构师训练营

          第十一周 安全稳定作业

          蓝黑

          极客大学架构师训练营

          第十一周 安全稳定总结

          蓝黑

          极客大学架构师训练营

          《写给大忙人看的JAVA核心技术》.pdf

          田维常

          电子书

          KMP —— 字符串分析算法

          三钻

          算法 大前端 KMP

          话题讨论 | 程序员摸鱼的时候都喜欢干些什么

          soolaugust

          话题讨论

          App自动化《元素定位方式、元素操作、混合应用、分层设计、代码方式执行Pytest 命令》

          清菡软件测试

          App

          云计算领域-杨明越加入InfoQ协作平台

          杨明越

          Spring 源码学习 08:register 注册配置类

          程序员小航

          Java spring 源码 源码阅读

          手撸一个在线css三角形生成器

          徐小夕

          CSS css3 大前端 CSS小技巧

          第七周总结

          小兵

          突破容量极限:TiDB 的海量数据“无感扩容”秘籍

          京东科技开发者

          分布式数据库 #TiDB

          智慧公安情报指挥合成作战管控平台开发

          t13823115967

          智慧公安情报研判系统开发 智慧公安 合成作战管控平台

          话题讨论 | go、php 、java、python、cpp谁才能成为后端的主流

          sinsy

          Java c++ php 话题讨论 Go 语言

          话题讨论 | 2020年你有什么推荐的书

          soolaugust

          话题讨论

          架构师训练营第 1 期第 11 周作业

          owl

          极客大学架构师训练营

          CSS flex 排版与动画 — 重学 CSS

          三钻

          CSS 大前端 排版 Flex

          基于区块链技术落地应用开发-食品溯源

          13828808769

          阿里云Lindorm与Intel、OSIsoft共建IT & OT超融合工业数据云

          许力

          数据库 大数据 IoT 工业互联网 工业物联网

          探秘密码学:深入了解对称加密与密钥协商技术

          京东科技开发者

          网络安全 密码学

          阿里巴巴内部秘密培养的“Java架构师养成计划”图谱曝光,全是干货!

          Java架构追梦

          Java 学习 架构 面试 阿里巴巴人才培养计划

          低成本快速上链 智臻链开放联盟网络正式对外开放

          京东科技开发者

          区块链 京东

          Seata是什么?一文了解其实现原理

          vivo互联网技术

          分布式 分布式事务 分布式架构

          公安情报研判管控分析平台建设解决方案

          t13823115967

          智慧公安情报研判系统开发 智慧公安 情报研判管控分析平台

          话题讨论 | 作为开发你是如何阅读源码的?

          程序员小航

          话题讨论

          话题讨论 | 深入浅出Linux内存管理,图解物理内存和虚拟内存

          程序员柠檬

          话题讨论

          线程上下文切换,这些是你需要掌握的

          田维常

          系统上下文

          源码深度解析 Handler 机制及应用

          vivo互联网技术

          android 客户端开发

          什么是工作流?工作流有什么作用?怎样配置工作流程?

          Marilyn

          敏捷开发 工作流

          我是程序员,我用这种方式铭记历史

          kokohuang

          Hexo GitHub Pages python 爬虫 中国历史 铭记历史

          Sora 刚正式登场就把OpenAI系统干废了!Altman紧急暂停新用户注册_AI&大模型_褚杏娟_InfoQ精选文章