阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

OpenAI Sora 发布时间“定档”,可能允许内容中出现裸体

  • 2024-03-15
    北京
  • 本文字数:2246 字

    阅读完需:约 7 分钟

大小:1016.13K时长:05:46
OpenAI Sora发布时间“定档”,可能允许内容中出现裸体

OpenAI 公司首席技术官 Mira Murati 最近在接受《华尔街日报》采访时,透露 Sora 将于“今年”推出,“可能需要几个月”。

 

Murati 于 2018 年加入 OpenAI,担任应用人工智能与合作关系副总裁。彼时,OpenAI 的研究工作正处于快速发展阶段,巨额开支也逐渐超出其承受能力。2019 年,OpenAI 转型为盈利实体,但设置了盈利上限。

 

Murati 在 OpenAI 晋升迅速,先后担任产品与合作关系高级副总裁,以及首席技术官 (CTO)。 在她担任 CTO 期间,OpenAI 发布了 DALL-E 2 和 ChatGPT 等备受瞩目的 AI 产品,引起了公众的广泛关注。

 

《华尔街日报》的这次采访广泛探讨了相关主题,包括 AI 引擎能够生成哪些内容类型、以及当前正在实施的安全措施。打击错误信息已经成为目前 OpenAI 公司的工作重点。Murati 表示,Sora 将设置多重安全护栏,以确保该项技术不会遭到滥用。她解释称,开发团队不希望发布“可能影响全球选举”的功能。报道指出,Sora 将遵循与 Dall-E 相同的提示词政策,即拒绝生成美国总统等“公众人物形象”。

 

Sora 的正式版本还将为输出添加水印。画面右下角将显示半透明的 OpenAI 标识,表示内容为 AI 生成产物。Murati 补充道,开发团队还考虑将内容来源作为另一项重要指标,即使用元数据来提供关于数字媒体的来源信息。这些努力当然都很好,但恐怕还远远不够。去年,一组研究人员已经成功打破了“现有图像水印保护”机制,其中也包括 OpenAI 的保护方案。希望这次开发团队能想出更加牢不可破的新办法。

 

更多生成功能

 

和传闻中生成视频需要数个小时的说法不同,现场展示 Sora 生成一段 20 秒长、720P 分辨率的视频,只用了几分钟。

 

另外,Sora 的运行成本要比 Dall-E“贵很多”。OpenAI 正在尝试使这个工具在公开发布时的成本与公司的 AI 文本到图片模型 DALL-E“相似”。

 

在聊起 Sora 的未来发展时,Murati 带来了不少有趣的消息。首先,开发团队计划“最终”为视频添加声音,以使其观感更加真实。编辑工具也在筹备当中,希望为在线创作者提供一种修复 AI 错误的良好方法。

 

尽管 Sora 已经相当先进,但它同样会经常犯错。采访中最突出的例子就是一段提示词,其要求引擎生成一段视频,内容是机器人从一名女性手中偷走相机。可结果恰恰相反,片段显示女子身体有一部分变成了机械结构。Murati 承认 Sora 仍有改进的空间,并表示 Sora AI“在连续性方面已经相当出色,但还不够完美”。

 


此外,展示裸体也被提上了议程。Murati 指出,OpenAI 正在与“艺术家们……共同探索”可以展示哪些裸体内容:“就像你可以想象的那样…… 艺术家们可能希望在创作过程中拥有更多的控制权。目前,我们正与来自不同领域的艺术家和创作者合作,共同探索最实用的功能,以及该工具应该提供怎样的灵活性水平。”

 

开发团队发现“艺术性”的裸体和严禁未经同意的 deepfakes 之间似乎并没有不可调和的矛盾。当然,OpenAI 肯定不希望被再次卷入的舆论讨伐的中心,他们的唯一目标是把自家产品打造成拓展创造力的平台。

 

测试仍在持续进行

 

在被问及 Sora 使用的训练数据时,Murati 的态度则有些躲闪。OpenAI 最近面临版权侵权诉讼,指控该 AI 公司在未经许可的情况下抓取内容来训练 ChatGPT。 

 

她先是宣称,据她所知除了“公开可用的数据及许可数据”之外,应该没有使用其他数据来训练 AI。但 Murati 也承认,她并不确定有训练期间有没有使用过来自 YouTube、Facebook 或者 Instagram 的视频素材。而且她后来坦言,确实有使用 Shutterstock 的媒体内容进行训练。这里给大家提个醒,Shutterstock 与 OpenAI 之间属于合作伙伴关系,也许这就是 Murati 愿意确认这一素材来源的理由。

 


有网友评论说:“耐人寻味的是,当被问及他们训练数据来源时,Murati 的回答非常谨慎。她的肢体语言透露了很多信息,很明显他们使用了来自受版权保护来源的训练数据。多少有点「事后求原谅,而非事先请求许可」的意思。”

 


Sora 项目人员 Tim Brooks 在接受其他媒体采访时,也对“使用什么训练数据的问题”的问题避而不答:“这个不方便说太细,但大体上,包括公开数据及 OpenAI 的被授权数据。”

 

不过 Tim Brooks 在回答这个问题中,也额外分享了他们的通过海量视频数据进行训练的一个细节:“以前,不论图像还是视频模型,大家通常只在一个固定尺寸上进行训练。而我们使用了不同时长、比例和清晰度的视频,来训练 Sora。至于做法,我们把各种各样的图片和视频,不管是宽屏的、长条的、小片的、高清的还是低清的,我们都把它们分割成了一小块一小块的。接着,我们可以根据输入视频的大小,训练模型认识不同数量的小块。通过这种方式,我们的模型就能够更加灵活地学习各种数据,同时也能生成不同分辨率和尺寸的内容。”

 

Murati 承诺 Sora“肯定”会在今年年底前推出,但并没有给出确切日期,只表示应该会在未来几个月内发布。目前,开发团队仍在对引擎进行安全测试,希望找到任何“漏洞、偏见以及其他有害结果”。

 

如果大家想要第一时间体验 Sora,我们建议您首先学会使用编辑软件。毕竟需要牢记一点,Sora 会犯很多错误,哪怕在正式版发布后也不可能彻底避免。总之,让我们共同期待这位新秀的亮相演出!

 

参考链接:

https://www.wsj.com/tech/personal-tech/openai-cto-sora-generative-video-interview-b66320bb

https://archive.ph/D1pdw#selection-4625.38-4625.44

https://www.techradar.com/computing/artificial-intelligence/openais-sora-will-one-day-add-audio-editing-and-may-allow-nudity-in-content

https://www.reddit.com/r/OpenAI/comments/1bdta0a/mira_murati_says_openai_plans_to_release_sora/

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-03-15 10:326927

评论

发布
暂无评论

问:React的setState为什么是异步的?

beifeng1996

React

高级前端二面vue面试题(持续更新中)

bb_xiaxia1998

Vue

前端一面常考手写面试题整理

helloworld1024fd

JavaScript

2023-02-12:给定正数N,表示用户数量,用户编号从0~N-1, 给定正数M,表示实验数量,实验编号从0~M-1, 给定长度为N的二维数组A, A[i] = { a, b, c }表示,用户i报

福大大架构师每日一题

算法 rust 福大大

三次握手与四次挥的问题,怎么回答?

loveX001

JavaScript

promise执行顺序面试题令我头秃,你能作对几道

loveX001

JavaScript

老生常谈React的diff算法原理-面试版

beifeng1996

React

vivo 自研Jenkins资源调度系统设计与实践

vivo互联网技术

运维 jenkins 资源调度

FL Studio2023最新版本音乐编曲制作软件

茶色酒

FL Studio2023

架构实战营-模块一作业

🐢先生

架构实战营

1行Python代码去除图片水印,网友:干干净净!

程序员晚枫

Python GitHub 开源 去水印 自动化办公

用Docker搭建更酷的本地开发环境

致知Fighting

Java Docker Linux 后端 开发

Vue.$nextTick的原理是什么-vue面试进阶

bb_xiaxia1998

Vue

被流量和热度裹挟,自媒体行业必须坚守职业道德

石头IT视角

为什么补码是取反加1?

Dinfan

前端必会面试题

loveX001

JavaScript

实现一个简单的Database9(译文)

GreatSQL

sqlite greatsql greatsql社区

KMP算法详解

javaadu

数据结构 字符串 KMP

前端react面试题指南

beifeng1996

React

Vue的computed和watch的区别是什么?

bb_xiaxia1998

Vue

百度前端常考vue面试题(附答案)

bb_xiaxia1998

Vue

A-Ops性能火焰图——适用于云原生的全栈持续性能监测工具

openEuler

Linux 运维 操作系统 定位 性能监控

Shell分支语句

圆弧

分支 条件 shell脚本

为什么用元空间替代永久代?

王磊

java面试

2023我的前端面试小结

loveX001

JavaScript

手写JS函数的call、apply、bind

helloworld1024fd

JavaScript

一个容器,但是一整个k8s集群

newbe36524

C# Docker Kubernetes

前端react面试题(边面边更)

beifeng1996

React

产品的可持续发展

ShineScrum捷行

产品 产品负责人 产品的可持续发展

零基础入门AI?先来把机器学习捣鼓明白吧

博文视点Broadview

焕新启航,「龙蜥大讲堂」2023 年度招募来了!13 场技术分享先睹为快

OpenAnolis小助手

直播 开源社区 龙蜥大讲堂 机密计算 月度主题

OpenAI Sora发布时间“定档”,可能允许内容中出现裸体_生成式 AI_Tina_InfoQ精选文章