【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

估值 62 亿美元,Databricks 会成为企业 AI 平台的黑马吗?

  • 2019-12-13
  • 本文字数:2491 字

    阅读完需:约 8 分钟

估值62亿美元,Databricks会成为企业AI平台的黑马吗?

作为 Databricks 的 CEO,Ali Ghodsi 的好日子来了。他刚刚完成一轮 4 亿美元的融资,让公司的估值达到了 62 亿美元。这轮融资几乎不费吹灰之力,他说“这是我经历过的最容易的一次融资”。除了拿到融资,Ghodsi 还透露了他的下一个终极目标:构建业内第一个企业 AI 平台。



Databricks CEO Ali Ghodsi


2013 年,Databricks 成立,有些人认为它跟当时不可一世的其他商业开源平台厂商没有什么两样。毕竟,Databricks 的创始人们都曾经是 Apache Spark 背后的功臣,包括 Matei Zaharia(在加州大学伯克利分校 AMPLab 学习时开发出了 Spark),还有其他来自 AMPLab 或伯克利计算机学院的同僚们,如 Ion Stoica、Reynold Xin、Andy Konwinski 和 Arsalan Tavakoli-Shiraji。


如果说 Spark 是继 Hadoop 之后的一个创举——它确实是,并且会持续下去——那么 Databricks 很可能会找到某种方式来让 Spark 变现。Databricks 之于 Spark,就像 Cloudera 之于 Hadoop,或者 MongoDB 之于 NoSQL 数据库。但事情不会就这么简单地发展下去,Databricks 不会只骑着 Spark 这只小马走天涯,实际上,它已经另辟蹊径,朝着另一个方向出发了。虽说 Spark 确实是 Databricks 公司规划的一部分,但充其量也只是他们多元化 SaaS 产品的一个组成元素。

企业 AI 的出现

在一次采访中,Ghodsi 透露了这些产品将如何帮助他们实现公司的终极目标:构建世界上第一个企业 AI 平台。


“每个人都在想谁会成为第一家推出企业 AI 平台的上市公司?它又将如何帮助企业将 AI 集成到他们现有的软件系统和解决方案中?每一个软件系统——我是说所有现有的软件系统——在未来十年都将变得更加智能。他们要么在软件系统中加入 AI 能力,要么被市场淘汰,或者被其他拥有 AI 能力的公司打败”。


“我们已经看到了 Uber 颠覆了出租车行业,Airbnb 震动了旅馆行业,亚马逊把零售商店打得落花流水,这些事情都已经发生了。他们都使用了 AI 技术。那么其他世界 5000 强公司呢?他们有自己的软件系统,积累了几十年的客户,手里掌握着巨大的数据集。他们可以利用这些数据为自己的软件系统构建 AI 能力吗?我想,他们当中有一部分会的,如果这样做,他们就可以继续生存下去,还有一部分不这么做的将被具备 AI 能力的新公司取代。那么,他们会使用怎样的 AI 平台?在目前看来,这个问题还没有答案……因此,我认为平台公司是时候亮相了,让平台公司为这些软件公司构建 AI 平台,帮助他们把 AI 能力集成到他们的解决方案中”。


在企业计算领域,行业可能会选出一两个或者两三个 AI 平台作为标杆,就像之前将关系型数据库作为第一代企业软件(ERP、CRM、金融软件、HR 软件,等等)的支撑一样。但目前还没有出现标杆企业 AI 平台,尽管有一些玩家(AWS、微软和 Salesforce)已经跃跃欲试。在 Ghodsi 看来,Databricks 手里握着几张王牌,即便它不一定会成为标杆。


“基于开源的创新是关键。我们有四个项目,除了大家熟知的 Spark,迄今为止我们所做的最大的创新应该是 Delta Lake,我们有超过 80%的用户在使用它。从价值方面来看,它是 Databricks 最有价值的项目,尽管它没有 Spark 那么有名”。


MLFlow 是 Databricks 的另一张王牌。Zaharia 率先开发了这款软件,它为数据科学家构建、测试和部署机器学习模型这个复杂的过程提供了标准化。Ghodsi 透露,MLFlow 的下载量以每月 80 万的速度增长,而且比 Spark 有更多的贡献者。


Databricks 的第四张王牌是 Koalas,它将 Pandas 社区的数据科学创新带给了 Spark 用户。Ghodsi 说,Koalas 可以让数据科学家在笔记本电脑上使用 Pandas 编程,然后调用几个 API 就可以将工作负载部署到大型的分布式 Spark 集群上。

知识产权保护

除了软件产品本身,Ghodsi 认为 Databricks 的业务模式具备一个关键的优势。Ghodsi 有意识地将 Databricks 的业务模式与典型的开源商业模式区分开来。在典型的开源商业模式下,软件免费,厂商收取支持和服务费用。Ghodsi 把它叫作红帽模式,这种模式在预置(on-prem)软件世界里或许可行,但在新的云计算世界可能找不到自己的位置。


Ghodsi 说:“我们的业务模式跟其他的不一样,我们是云端托管的 SaaS 服务。在云端托管开源项目并把它们租给用户,这是一种更好的业务模式。这种模式的客户流失率更低,客户会更开心,利润增长更快”。


SaaS 租赁模式还为 Databricks 的资产(也就是知识产权)提供了保护。Databricks 的核心知识产权并不存在于它所赞助的软件项目中,因为这些软件项目是公开的。事实上,Databricks 最有价值的知识产权存在于它用来监控和管理云端软件的工具和技术中,它们不会像经典的开源模式那么容易被泄露。


Ghodsi 说:“到了云端,很多东西都会变得不一样。在云端,用户租赁 Databricks 的服务,我们负责保证安全性、可靠性和可用性。我们负责监控这些东西,确保它们保持运行状态。我们确保在有新版本出现时它们也能保持最新。我们负责所有的一切,而租用我们服务的公司可以高枕无忧”。


Databricks 使用开源软件(如 Kubernetes)为各种数据工程、数据分析和机器学习负载提供伸缩能力,还开发了专有软件来保证云服务的可用性。


Ghodsi 说:“保持服务运行是很困难的一件事情,而大规模运行则更难。我们每天需要在 AWS 上启动一百万个虚拟机,这件事本身就很难,而确保它们正常运行、监控它们、保证它们的安全性和可靠性,也很难。这也就是为什么用户需要付钱给我们”。


Uber、Airbnb 和亚马逊已经投入数亿美元用于构建自己的数据工程和 AI 系统,这让它们在各自的市场中占有一席之地。现在,Ghodsi 想要帮助其他企业构建自己的 AI 能力,或者至少是尝试一下。


他说:“关键在于我们不希望用户操心太多东西,我们会为他们操办一切,包括安装、管理和升级软件系统。我们希望用户可以把精力放在解决 AI 问题和业务问题上……我不明白为什么一家想研发慢性肝病药物的公司要去关心 Kubernetes 以及如何管理和配置 Kubernetes 集群。这些事情应该在幕后进行,而这些也就是我们要做的”。


从业务模式来看,Databricks 有可能会是赢家。


原文链接:


https://www.datanami.com/2019/12/02/will-databricks-build-the-first-enterprise-ai-platform/


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-12-13 12:042860
用户头像
蔡芳芳 InfoQ主编

发布了 778 篇内容, 共 489.3 次阅读, 收获喜欢 2746 次。

关注

评论

发布
暂无评论
发现更多内容

DevData Talks | 大咖集结『研发效能答疑专场』即将开始!

思码逸研发效能

研发管理 研发效能 研发管理工具

如何使用 Towify 在小程序中实现勾选用户协议后登录?

Towify

微信小程序 无代码 触发器

promise执行顺序面试题令我头秃,你能作对几道

loveX001

JavaScript

版本更新 | Towify V1.24.0 有哪些实用新功能?汇总来了!

Towify

架构实战营 - 模块 2- 作业

zealot0317

教你用JavaScript完成简易贪吃蛇小游戏

小院里的霍大侠

JavaScript 编程开发 实战案例 初学者 入门实战

Dubbo架构设计与源码解析(一) 架构设计

京东科技开发者

云原生 dubbo Java、 架构设计 分布式架构

数据可视化图表系列解析——柱状图

Data 探险实验室

数据分析 可视化 数据可视化 BI 分析工具 可视化数据

web前端经典react面试题

beifeng1996

React

老生常谈React的diff算法原理-面试版

beifeng1996

React

昨天,同事优化加锁方式时,出现死锁了

华为云开发者联盟

高并发 开发 华为云 12 月 PK 榜

二十大专题,3000道 Java后端核心面试解析,国内超牛的《Java 面试突击核心手册》重磅来袭!

架构师之道

编程 程序员 java面试

跨平台应用开发进阶(二十五) :uni-app实现IOS云打包解决IOS提交审核相册等隐私描述语导致审核失败问题

No Silver Bullet

uni-app 12月月更 IOS云打包 提交审核 隐私描述语

三次握手与四次挥的问题,怎么回答?

loveX001

JavaScript

vivo 云原生容器探索和落地实践

vivo互联网技术

机器学习 AI 容器 云原生 k8s

社招前端二面react面试题整理

beifeng1996

React

时隔3个月,Uber 再遭数据泄露...

SEAL安全

数据泄露 uber 第三方风险 12 月 PK 榜

前端leetcde算法面试套路之堆

js2030code

JavaScript LeetCode

百度工程师带你探秘C++内存管理(ptmalloc篇)

百度Geek说

c++ Linux 内存管理 12 月 PK 榜

程序员职场晋升:与阿里前P9的一次近距离互动

博文视点Broadview

跨平台应用开发进阶(二十四) :uni-app实现文件下载并保存

No Silver Bullet

uni-app 12月月更 文件下载 文件保存

最新前端面试总结

loveX001

JavaScript

关系型数据库设计三大范式

京东科技开发者

关系型数据库 数据库设计 范式 冗余 数据库·

前端面试比较好的回答

loveX001

JavaScript

ClassLoader 隔离性的基石是namespace,证明给你看

小小怪下士

Java 程序员 面试

NeurIPS 2022:基于语义聚合的对比式自监督学习方法

华为云开发者联盟

人工智能 华为云 论文 12 月 PK 榜

问:React的setState为什么是异步的?

beifeng1996

React

前端leetcde算法面试套路之树

js2030code

JavaScript LeetCode

跨平台应用开发进阶(二十六) :忐忑悲壮路,心酸出坑史——记第一次iOS艰辛上架路

No Silver Bullet

uni-app iOS上架 12月月更 问题汇总

2022 阿里灵杰AI开发者峰会内容抢先看!

阿里云大数据AI技术

人工智能 阿里云

如何配置分享到微信功能?

Towify

微信小程序 无代码 触发器

估值62亿美元,Databricks会成为企业AI平台的黑马吗?_文化 & 方法_Alex Woodie_InfoQ精选文章