写点什么

估值飙升至 280 亿美元!大数据独角兽公司 Databricks 再获 10 亿美元融资

  • 2021-02-02
  • 本文字数:3290 字

    阅读完需:约 11 分钟

估值飙升至280亿美元!大数据独角兽公司Databricks再获10亿美元融资

美国时间 2021 年 2 月 1 日上午,由 Apache Spark 初始成员创立的大数据初创公司 Databricks 宣布已完成 10 亿美元 G 轮融资。据悉,本轮融资由富兰克林·邓普顿(Franklin Templeton)领投,Fidelity、AWS、Alphabet(谷歌母公司)的 CapitalG、Salesforce Ventures 和早前参与过投资的微软等多家投资方跟投。新一轮融资过后,Databricks 最新估值达到 280 亿美元,与2019年10月份完成F轮融资时的估值 62 亿美元相比,飙升近五倍。


据了解,这笔资金将用于加速 Databricks 的创新,并帮助公司继续扩大规模和支持 Lakehouse 的快速采用。



公有云在欧美国家已经成为主流,即使在数据架构最保守的金融业也是如此。美国信用卡行业巨擘 Capital One Bank 在 2020 年冬天完全关闭了所有的数据中心,全线进入公有云。无独有偶,美国国防部 100 亿美金的 JEDI 项目也在九月正式确认选择微软的云服务

 

在公有云的大背景下,云原生成为了新一代数据架构的主流标准。公有云所提供的对象存储、弹性计算、按需使用等特性在架构设计的考虑中需要重新设计。除了公有云厂商的标配服务外,如 SnowFlake、Databricks 等跨云平台的第三方服务提供商自然也受到用户和资本市场的追捧。

 

富兰克林·邓普顿(Franklin Templeton)高级副总裁、研究分析师兼投资组合经理 Jonathan Curtis 表示:“我们很高兴能与 Databricks 一起进入令人印象深刻的旅程的下一个阶段。我们已经亲眼看到他们帮助企业利用数据更好地了解客户、实现业务流程并最终建立起基于数据的竞争优势的能力。我们相信 Databricks 未来将建立明确的领导地位并拥有广阔的增长机会。”

 

微软公司云与人工智能执行副总裁 Scott Guthrie 则表示:“ Azure Databricks 一直是一个令人印象深刻的解决方案,它为我们的客户带来了开放、灵活和可扩展的数据和 AI 方面的最新能力。这次投资再次强调了这一愿景:我们会与 Databricks 共同为客户简化数据和 AI。我们将共同努力,继续推进 Azure Databricks、跨 Azure 数据服务无缝集成工作,以在 Azure 上实现云规模分析和 AI 能力。”

 

据外媒报道,华尔街对 Databricks 在 2021 年正式 IPO 抱有非常高的期待。一位知情人士表示:“当 Databricks 上市时,其市值可能会达到 350 亿美元,甚至可能高达 500 亿美元。” 

 

作为参考,云原生的数据仓库提供商 SnowFlake 在 2020 年 9 月正式 IPO 时筹资 33.6 亿美元、市值达到 330 亿美元,此后市值更一度攀升至超过一千亿美元,远远高于其 IPO 前进行最后一轮融资时的估值 124 亿美元。

 

此前,Databricks 的首席执行官 Ali Ghodsi 曾在 2019 年初表示,公司可能会在未来两年左右考虑 IPO ,若按此时间推算,正好就是 2021 年。

 

据彭博社 2020 年 10 月报道,Databricks 还处于 IPO 规划的早期阶段,公司正在与投资机构沟通,但尚未选定任何一家股票承销商。

 

Databricks 是否会在今年内正式登陆纳斯达克,值得期待。

Databricks 发展历程:从 Spark 到企业 AI 平台

Databricks 成立于 2013 年,公司创始人都曾经是 Apache Spark 背后的功臣,包括 Matei Zaharia(在加州大学伯克利分校 AMPLab 学习时开发出了 Spark),还有其他来自 AMPLab 或伯克利计算机学院的同僚们,如 Ion Stoica、Reynold Xin、Andy Konwinski 和 Arsalan Tavakoli-Shiraji。

 

Spark 之于 Databricks,就像 Hadoop 之于 Cloudera,或者 NoSQL 数据库之于 MongoDB。Spark 确实是 Databricks 公司规划的关键部分,但也只是他们多元化 SaaS 产品的一个组成元素。

 

在一次采访中,Ali Ghodsi 透露了公司的终极目标:构建世界上第一个企业 AI 平台。

 

“每个人都在想谁会成为第一家推出企业 AI 平台的上市公司?它又将如何帮助企业将 AI 集成到他们现有的软件系统和解决方案中?每一个软件系统——我是说所有现有的软件系统——在未来十年都将变得更加智能。他们要么在软件系统中加入 AI 能力,要么被市场淘汰,或者被其他拥有 AI 能力的公司打败”。

 

“我们已经看到了 Uber 颠覆了出租车行业,Airbnb 震动了旅馆行业,亚马逊把零售商店打得落花流水,这些事情都已经发生了。他们都使用了 AI 技术。那么其他世界 5000 强公司呢?他们有自己的软件系统,积累了几十年的客户,手里掌握着巨大的数据集。他们可以利用这些数据为自己的软件系统构建 AI 能力吗?我想,他们当中有一部分会的,如果这样做,他们就可以继续生存下去,还有一部分不这么做的将被具备 AI 能力的新公司取代。那么,他们会使用怎样的 AI 平台?在目前看来,这个问题还没有答案……因此,我认为平台公司是时候亮相了,让平台公司为这些软件公司构建 AI 平台,帮助他们把 AI 能力集成到他们的解决方案中”。

 

在企业计算领域,行业可能会选出一两个或者两三个 AI 平台作为标杆,就像之前将关系型数据库作为第一代企业软件(ERP、CRM、金融软件、HR 软件,等等)的支撑一样。但目前还没有出现标杆企业 AI 平台,尽管有一些玩家(AWS、微软和 Salesforce)已经跃跃欲试。在 Ghodsi 看来,Databricks 手里握着几张王牌,即便它不一定会成为标杆。

 

“基于开源的创新是关键。我们有四个项目,除了大家熟知的 Spark,迄今为止我们所做的最大的创新应该是 Delta Lake,我们有超过 80%的用户在使用它。从价值方面来看,它是 Databricks 最有价值的项目,尽管它没有 Spark 那么有名”。

 

MLFlow 是 Databricks 的另一张王牌,它为数据科学家构建、测试和部署机器学习模型这个复杂的过程提供了标准化。Ghodsi 透露,MLFlow 的下载量以每月 80 万的速度增长,而且比 Spark 有更多的贡献者。

 

Databricks 的第四张王牌是 Koalas,它将 Pandas 社区的数据科学创新带给了 Spark 用户。Ghodsi 说,Koalas 可以让数据科学家在笔记本电脑上使用 Pandas 编程,然后调用几个 API 就可以将工作负载部署到大型的分布式 Spark 集群上。

进击的 SaaS 业务模式

除了软件产品本身,Ghodsi 认为 Databricks 的业务模式具备一个关键的优势。Ghodsi 有意识地将 Databricks 的业务模式与典型的开源商业模式区分开来。在典型的开源商业模式下,软件免费,厂商收取支持和服务费用。Ghodsi 把它叫作红帽模式,这种模式在预置(on-prem)软件世界里或许可行,但在新的云计算世界可能找不到自己的位置。

 

Ghodsi 说:“我们的业务模式跟其他的不一样,我们是云端托管的 SaaS 服务。在云端托管开源项目并把它们租给用户,这是一种更好的业务模式。这种模式的客户流失率更低,客户会更开心,利润增长更快”。

 

SaaS 租赁模式还为 Databricks 的资产(也就是知识产权)提供了保护。Databricks 的核心知识产权并不存在于它所赞助的软件项目中,因为这些软件项目是公开的。事实上,Databricks 最有价值的知识产权存在于它用来监控和管理云端软件的工具和技术中,它们不会像经典的开源模式那么容易被泄露。

 

Ghodsi 说:“到了云端,很多东西都会变得不一样。在云端,用户租赁 Databricks 的服务,我们负责保证安全性、可靠性和可用性。我们负责监控这些东西,确保它们保持运行状态。我们确保在有新版本出现时它们也能保持最新。我们负责所有的一切,而租用我们服务的公司可以高枕无忧”。

 

Databricks 使用开源软件(如 Kubernetes)为各种数据工程、数据分析和机器学习负载提供伸缩能力,还开发了专有软件来保证云服务的可用性。

 

Ghodsi 说:“保持服务运行是很困难的一件事情,而大规模运行则更难。我们每天需要在 AWS 上启动一百万个虚拟机,这件事本身就很难,而确保它们正常运行、监控它们、保证它们的安全性和可靠性,也很难。这也就是为什么用户需要付钱给我们”。

 

Uber、Airbnb 和亚马逊已经投入数亿美元用于构建自己的数据工程和 AI 系统,这让它们在各自的市场中占有一席之地。现在,Ghodsi 想要帮助其他企业构建自己的 AI 能力,或者至少是尝试一下。

 

他说:“关键在于我们不希望用户操心太多东西,我们会为他们操办一切,包括安装、管理和升级软件系统。我们希望用户可以把精力放在解决 AI 问题和业务问题上……我不明白为什么一家想研发慢性肝病药物的公司要去关心 Kubernetes 以及如何管理和配置 Kubernetes 集群。这些事情应该在幕后进行,而这些也就是我们要做的”。


延伸阅读:

 

《从五家领先硅谷公司看中国To B软件企业的“危”与“机”》

2021-02-02 03:0125416
用户头像
蔡芳芳 InfoQ 总编辑

发布了 813 篇内容, 共 590.3 次阅读, 收获喜欢 2808 次。

关注

评论 1 条评论

发布
用户头像
,Databricks 最有价值的知识产权存在于它用来监控和管理云端软件的工具和技术中
学习了,真机智
2021-02-08 10:09
回复
没有更多了
发现更多内容

阅读完synchronized和ReentrantLock的源码后,我竟发现其完全相似

Java 源码 synchronized ReentrantLock

全量通过,华为云GaussDB首批完成信通院全密态数据库评测

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

Gradio:快速构建你的webApp

AIWeker

Python 三周年连更 Gradio

GitHub上线重量级分布式架构原理设计笔记,开源的东西看着就是爽

Java你猿哥

架构 分布式 分布式架构

4 月 22 日丨【云数据库技术沙龙】技术进化,让数据更智能

NineData

MySQL 数据库 程序员 开发者 Clickhouse

“淄”味当道,工赋十足

Openlab_cosmoplat

开源社区 双碳

【堡垒机小知识】堡垒机能记录操作时间、操作数据等等吗?

行云管家

网络安全 堡垒机

Scrum敏捷研发和项目管理

顿顿顿

Scrum 敏捷开发 敏捷开发流程 leangoo 敏捷开发管理工具

火山引擎云原生数据仓库ByteHouse技术白皮书V1.0 (Ⅲ)

字节跳动数据平台

数据仓库 云原生 白皮书 数据仓库服务 企业号 4 月 PK 榜

从源码角度深入解析Callable接口

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜

Kurator v0.3.0版本发布!助力企业实现多云异构管理

华为云开发者联盟

开源 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

Java中线程的6种状态详解(NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING、TERMINATED)

共饮一杯无

Java 线程 线程状态 三周年连更

热榜!Alibaba最新发布「10亿级并发系统设计文档」Git狂揽9000星

Java你猿哥

数据库 架构 分布式 架构设计 并发系统

【架构与设计】常见微服务分层架构的区别和落地实践

京东科技开发者

架构 微服务 DDD 分层架构 企业号 4 月 PK 榜

接口设计文档的12个注意点

Java 后端开发 接口设计

挑战 30 天学完 Python:Day9 条件语句

MegaQi

Python 挑战30天学完Python 三周年连更

阅读完synchronized和ReentrantLock的源码后,竟发现其完全相似

Java你猿哥

并发编程 并发 synchronized SSM框架 ReentrantLock

带你一同认识和使用JPA框架进行开发你的应用服务

Java你猿哥

Java SSM框架 jpa Java工程师

火山引擎 DataLeap下Notebook系列文章一:技术选型之路

字节跳动数据平台

notebook 数据研发 企业号 4 月 PK 榜

Kubernetes集群调度增强之超容量扩容

京东科技开发者

Kubernetes k8s 集群 企业号 4 月 PK 榜 超容量扩容

从零学习SDK(7)如何打包SDK

MobTech袤博科技

火山引擎DataTester:让企业“无代码”也能用起来的A/B实验平台

字节跳动数据平台

AB testing实战 无代码 A/B 测试 企业号 4 月 PK 榜 企业增长

Linux:管道命令与文本处理三剑客(grep、sed、awk)

会踢球的程序源

Java Linux

女朋友要我讲解@Controller注解的原理,真是难为我了

Java你猿哥

Java spring Spring 配置解析

字节面试官:你没有高并发、性能调优经验,为什么录取你?

Java 高并发 性能调优

安装Zookeeper和Kafka集群

Java你猿哥

Java kafka zookeeper SSM框架 Java工程师

清单推荐:常见的研发效能度量指标(科学管理版)

LigaAI

研发管理 技术管理 效能度量 研发效能度量 企业号 4 月 PK 榜

Apifox 更新 | WebSocket 接口调试功能上线!

Apifox

程序员 开发工具 Apifox API 接口工具

华为云新一代iPaaS全域融合集成平台全新升级

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

面试了个985毕业的大佬,回答“性能调优”题时表情令我毕生难忘

Java 性能优化 性能调优

如何用scrum敏捷工具做迭代规划及迭代执行。

顿顿顿

Scrum Sprint 敏捷开发管理工具 敏捷工具 迭代规划

估值飙升至280亿美元!大数据独角兽公司Databricks再获10亿美元融资_大数据_蔡芳芳_InfoQ精选文章