NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

生成式 AI 火了,Stable Diffusion 幕后开发公司 Stability AI 宣布获得 1 亿美元融资

  • 2022-10-18
    北京
  • 本文字数:2180 字

    阅读完需:约 7 分钟

生成式AI火了,Stable Diffusion幕后开发公司Stability AI宣布获得1亿美元融资

生成式 AI 可太火了。


InfoQ10 月 18 日获悉,开源人工智能公司 Stability AI 宣布获得 1.01 亿美元融资。本轮投资由 Coatue、光速创投领投,O'Shaughnessy Ventures 参投。


所筹资金将用于加速开发面向全球消费者和企业用例的开放 AI 模型,包括图像、语言、音频、视频、3D 等。此外,这笔资金还将用于吸纳更多的人才。Stability AI CEO Emad Mostaque 表示,他预计明年,公司员工人数将从 100 人增加到约 300 人。最近,Stability AI 已招聘了几位有行业影响力的人才,包括来自 Google Brain 的研究科学家 hardmaru 以及未来学家、公共演讲者Daniel Jeffries


彭博社报道,一位因细节未公开而要求不具名的知情人士称,这轮融资完成后, Stability AI 的估值约为 10 亿美元,这意味着,Stability AI 成为新晋 AI 独角兽。


资料显示, Stability AI 由 CEO Emad Mostaque 于 2020 年创立,Emad Mostaque 毕业于牛津大学,获得数学和计算机科学硕士学位。此前他曾在多家对冲基金担任分析师,之后转向更面向公众的工作。Mostaque 曾称他创业的动机是个人对 AI 的迷恋以及他认为,开源 AI 社区缺乏“组织”。Mostaque 曾在采访中表示,“计划使用我们的计算来加速开源基础人工智能。”


这笔融资正是当下生成式 AI 火爆的一个表现,由人工智能驱动的内容生成需求正在加速增长。Stability AI 是近期大火的 AI 绘画神器 Stable Diffusion 背后的开发公司。


Stability AI 介绍,Stable Diffusion 是一个文本至图像的模型,它能让数十亿人在几秒钟内创建出令人赞叹的艺术品。在速度和质量方面,它都有所突破,这意味着它能在消费者级别的 GPU 上运行……这能够让研究人员和……公众在各种条件下运行,使图像生成技术走向大众。我们期待围绕该模型和其他模型出现一个开放的生态系统,以探索潜在空间的边界。


今年 9 月,Stability AI对外发布了Stable Diffusion的预训练模型权重,这是一个文本至图像的 AI 模型。根据文本提示,Stable Diffusion 能够生成逼真的 512x512 像素的图像以描述提示中的场景。在模型权重公开发布之前,它的代码已经发布,模型权重也有限发布给了研究社区。在最新的版本中,任何用户都可以在消费者级别的硬件中下载并运行 Stable Diffusion。


Stability AI 拥有一个在 AWS 中运行的由 4000 多个 Nvidia A100 GPU 组成的集群,用于训练包括 Stable Diffusion 在内的 AI 系统。


据 Business Insider 的报告称,该公司的维护成本相当高,其中运营和云支出超过 5000 万美元。但 Mostaque 一再强调,该公司的研发工作将使其能够更有效地训练模型。


Stable Diffusion 的很多用户已经公开发布了生成图像的样例,Stability AI 的首席开发者 Katherine Crowson 在推特上分享了许多图像


其所具备的高度开源取向使得 Stable Diffusion 将无过滤图像生成的门槛下放到历史最低。Stable Diffusion 能够提供开源、未经过滤的图像生成功能,而且任何具备一点点技术知识的电脑用户都能轻松上手。


Emad Mostaque 曾在一次采访中表示,“真实情况是,这是一项堪称超能力般的外星科技。我们第一次见到一种老少咸宜的 AI 图像生成工具,但同时也发现不少人在用它生成伤害他人感情的内容。”


尽管 AI 生成艺术已然经历了一段时间的发展,但 Stable Diffusion 的出现可能才是这项技术的真正腾飞时刻。它可以免费使用,上手快捷,大大减少了用户生成内容的障碍。


但火爆背后,Stable Diffusion 也无法逃脱诸多争议。当这样一款工具落在普罗大众手中,接下来会发生什么实在难以预料。


基于 AI 的图像合成可能会对艺术家和艺术领域带来一定的影响,有些评论者对此感到不安。就在 Stable Diffusion 发布的同一周,一幅由 AI 生成的艺术品在科罗拉多州博览会的艺术比赛中获得了一等奖Stable Diffusion 的开源版本已被用于创建令人反感的内容,例如暴力和色情、未经同意的名人深度伪造。出于对知识产权纠纷的担忧,Getty Images 禁止上传 Stable Diffusion 等系统生成的内容。


稳定性 AI 甚至成为美国众议院代表 Anna G. Eshoo (D-CA) 最近致国家安全顾问 (NSA) 和科技政策办公室的一封批评信的主题,她在信中敦促 NSA 和 OSTP 解决“不审核在其平台上制作的内容”的“不安全 AI 模型”的发布问题。


迄今为止,Stability AI 在很大程度上采取了一种不干涉的方法来进行审核,包括使用开源 Stable Diffusion 软件包的过滤工具,但允许用户和公司按照他们的意愿部署系统,只要他们遵守公司许可的条款。“有一部分人只是不愉快和奇怪,但这就是人性,”Emad Mostaque 在之前的一次采访中说。“事实上,我们相信这项技术将会流行,许多人工智能爱好者的家长式和有点居高临下的态度被误导为不信任社会。”


据悉,Stability AI 计划通过为客户培训“私有”模型并充当通用基础设施层来赚钱。它还提供了一个平台和 API,即 DreamStudio,个人用户可以通过该平台和 API 访问其模型。目前,DreamStudio 拥有超过 150 万用户,他们创建了超过 1.7 亿张图像,而 Stable Diffusion 每天有超过 1000 万用户“跨所有渠道。”


与此同时,Stability AI 今天上午发布的新闻稿显示,Stable Diffusion 的开源版本已被下载超过 20 万次。


除了 Stable Diffusion,Stability AI 声称还有其他可商业化的项目正在进行中,包括用于生成音频、语言、3D、甚至视频的 AI 模型,其中之一就是 Dance Diffusion,这是一种算法和一组工具,可以通过对数百小时的现有歌曲进行训练来生成音乐片段。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-10-18 18:285399
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.8 次阅读, 收获喜欢 1967 次。

关注

评论 1 条评论

发布
用户头像
有点意思
2022-10-19 09:53 · 浙江
回复
没有更多了
发现更多内容

一个数据顾问的成长之路

用友BIP

用友 用友iuap

6张图为你分析Kafka Producer 消息缓存模型

华为云开发者联盟

kafka 消息 Kafka Producer 消息缓存模型 消息缓存

web前端培训React合成事件原理解析

@零度

React web前端开发

动态卡片:富媒体内容井喷式增长下,新一代移动端动态研发的模式

蚂蚁集团移动开发平台 mPaaS

ios android 前端 mPaaS 卡片技术

Python——Scipy库,熬夜整理华为最新Python笔试题

程序媛可鸥

Python 程序员 面试

技术平台&应用开发专题月 | 赋能企业业务快速创新,实现云原生自由

用友BIP

用友 用友iuap

Java培训基础高频面试题八股文分享

@零度

JAVA开发

阿里通过度量把发版过程的不确定变成确定-构建闲鱼版本持续交付管道及度量

阿里云云效

云计算 阿里云 DevOps 云原生 度量

字节跳动流式数据集成基于Flink Checkpoint两阶段提交的实践和优化背景

字节跳动数据平台

大数据 flink 字节跳动 数据集成

Python 初学者进阶的九大技能,Python校招面试指南

程序媛可鸥

Python 程序员 面试

Python 实现二叉树前序,中序,后序,三面美团Python岗

程序媛可鸥

Python 程序员 面试

Python 实现数据结构中的的栈,队列,Python面试自我介绍

程序媛可鸥

Python 程序员 面试

电路模型和电路定律 (Ⅱ)

謓泽

3月月更

TSP 平台场景中的 MQTT 主题设计|车联网平台搭建从入门到精通 03

EMQ映云科技

开源 物联网 IoT mqtt emq

从持续交付到业务创新(上):互联网时代研发效能的核心

阿里云云效

云计算 阿里云 云原生 研发效能 持续交付

云小课|如何实现数据跨链交互?

华为云开发者联盟

区块链 数据 跨链 数据跨链 可信跨链服务

ShardingSphere-Proxy 5.0 分库分表(一)

神农写代码

python下载酷狗音乐上的歌曲,作为一个Python程序员你还不会JetPack

程序媛可鸥

Python 程序员 面试

JVM自定义类加载器在代码扩展性的实践

vivo互联网技术

JVM java 编程

JSON Schema 实现复杂结构表单数据展示

全象云低代码

前端 低代码 表单 JSON Schema

科技筑基、高效实战:中科柏诚信云链正当时

联营汇聚

iuap助力中国一汽数智化转型

用友BIP

用友 用友iuap

大数据培训flink8 个高频面试实战题分享

@零度

大数据 flink

产品手册怎么做?用什么软件?

小炮

阿里巴巴开源大规模稀疏模型训练/预测引擎DeepRec

阿里云大数据AI技术

机器学习 深度学习 搜索引擎 分布式训练 推荐引擎

Python 提取音乐频谱并可视化,字节面试官

程序媛可鸥

Python 程序员 面试

Python-Matplotlib可视化(8),毕业工作5年被裁

程序媛可鸥

Python 程序员 面试

龙蜥社区新增100+家合作伙伴,堡塔、东方通、宝德等头部企业均已加入

OpenAnolis小助手

开源 适配 合作伙伴 龙蜥社区 龙头企业

带你了解2022两会黑科技:阿里云视频云「AI编辑部3.0」

阿里云视频云

云计算 阿里云 AI 音视频 视频云

Python3十大经典错误及解决办法,这操作真香

程序媛可鸥

Python 程序员 面试

31岁的Python,蝉联年度编程语言排行榜冠军

JackTian

Python 编程 程序员 编程语言 后端

生成式AI火了,Stable Diffusion幕后开发公司Stability AI宣布获得1亿美元融资_AI&大模型_刘燕_InfoQ精选文章