Gartner2018 数据科学和机器学习平台魔力象限上的赢家和输家

阅读数:748 2018 年 3 月 8 日

话题:语言 & 开发架构文化 & 方法机器学习AI

Gartner 一直在变更这份报告的名称 (以及市场部分的内容)——2018 年 2 月 23 日发布的 2018 年最新版,被命名为《数据科学和机器学习平台的魔力象限》(在机器和学习之间有一个老式的破折号)。2017 年,报告名称是《数据科学平台的魔力象限》,2014-2016 年,名称则是《高级分析平台的魔力象限》。这些变化反应了行业在内容和能力上的快速改变,以及与 AI 和机器学习成长相关的品牌间的演变。

Gartner 这样定义数据科学和机器学习平台:

它是一个具有凝聚力的软件应用程序,提供基本的融合各构件模块的能力,既可以创建各种数据科学的解决方案,又可以将这个解决方案集成到业务流程及所涉及的周边基础设施及产品中去。

正如我们将在下面论述的那样,2018 年的变化将非常重要。

2018 年的报告采用多个标准评估了 16 家分析和数据科学公司,并基于产品前瞻性和执行力将它们放置在 4 个象限中。

请注意,虽然像 Python 和 R 这样的开源平台在数据科学市场中扮演着越来越重要的角色,但是 Gartner 的研究方法并没有包括它们。

图 1:Gartner 2018 数据科学和机器学习平台的魔力象限

公司介绍:

  • 领导者 (5):KNIME, Alteryx, SAS, RapidMiner, H2O.ai
  • 挑战者 (2):MathWorks, TIBCO 软件 (新进入)
  • 远见者 (5):IBM、微软、Domino 数据实验室、Dataiku、Databricks(新进入)
  • 特定领域者 (4):SAP、Angoss、Anaconda (新进入)、Teradata

2017 年新进入了三家公司:TIBCO 软件、Anaconda 和 Databricks。

在 2017 年的 MQ 中,还有 3 家公司被删除:FICO、Quest 和 Alpine 数据。我们注意到,Alpine 数据公司和 Quest 的 Statistica 资产被 TIBCO 收购,所以 TIBCO 出现在这次的 MQ 中,其位置接近于 2017 年的 Quest。

正如我们在之前的文章《Gartner 2017 数据科学平台 MQ :赢家和输家》中所做的那样,我们将最新的 2018 魔力象限与它之前的版本进行了比较。下面我们将研究这些变化以及其中的赢家和输家。

图 2:Gartner 对数据科学和机器学习平台的魔力象限进行比较,2018 vs 2017

图 2 显示了 2017 MQ(灰色背景图像) 和 2018 MQ(前景图像) 的对比状况,箭头连接的圆点表示同一家公司。如果公司的位置明显改善 (远离刚开始的位置) 箭头会是绿色的,位置变弱箭头将用红色表示。绿色圆圈代表新公司,而红色 X 表示公司离开了这次的魔力象限。

领导者:

自 2014 年以来,我们第一次有了改变。IBM 过去曾属于领导者,但由于执行能力较低,它被放到了远见者象限。KNIME 在前瞻性轴上有显著的进步,SAS 在同一轴上向后移动,RapidMiner 在执行能力上下降了一点。

2018 年有两家公司首次加入了领导者行列:H2O.ai,从远见者象限进入;Alteryx 公司,从挑战者象限进入。

下面是每个公司的简短介绍。对于完整报告,请参见文章末尾的链接。

KNIME 提供了开源的 KNIME 分析平台产品,全世界有超过 100K 用户。KNIME 为企业在协作、安全性和效率方面的部署提供商业支持和扩展。2017 年,KNIME 增加了 AWS 和微软 Azure 平台的云版本,提高了数据质量特征,扩展了深度学习能力。

Gartner 点评:

该厂商拥有对市场的深刻理解力、健壮的产品策略和丰富的用例优势。这些特质凝聚在一起,巩固了它作为领导者的地位。

Alteryx 平台可以使普通数据科学家能够在一个独立的工作流中构建模型。在 2017 年,Alteryx 成功进行了 IPO,后来收购了 Yhat,Yhat 是一个专注于模型部署和管理的数据科学供应商。

Gartner 点评:

Alteryx 已经从挑战者的象限发展到领导者象限。这要归功于强有力的执行 (在收入增长和客户获取方面),引人瞩目的客户满意度,以及专注于帮助组织机构在不需要聘请专家数据科学家的情况下引入数据和分析文化的产品愿景。

SAS 为分析和数据科学提供了许多软件产品。对于它的 MQ,Gartner 评估了 SAS 企业版 Miner (EM) 和 SAS 可视化分析套件的产品。

Gartner 点评:

SAS 仍然处在领导者行列,但是在前瞻性和执行力方面已经失去了一些优势。Visual Analytics 的套件遵循了产品愿景,因为它的 Viya 云就绪架构比以前的 SAS 架构更加开放,并且使得更多的用户能够获得分析能力。然而,令人困惑的多产品策略使 SAS 的产品前瞻性变得越来越糟糕,并且对高授权成本的理解削弱了它的执行力。随着市场的关注点转向开源软件和更灵活的产品,SAS 正在为自己在推出具有粘性的开放平台上的迟缓行为付出代价。

RapidMiner 平台包括 RapidMiner Studio 模型开发工具 (有免费版和商业版)、RapidMiner 服务器和 RapidMiner Radoop。

Gartner 点评:

RapidMiner 仍然处在领导者行列,它给各种各样的数据科学家和数据科学团队提供了一个全面且易于使用的平台。RapidMiner 通过提高生产力和性能能力,继续强化核心数据科学和模型开发及执行的速度。

H2O.ai 提供开源的机器学习平台产品,包括 H2O Flow,其产品的核心组件;H2O Steam;H2O Sparkling Water,用于 Spark 集成;以及 H2O Deep Water,它提供深度学习的能力。

Gartner 点评:

H2O.ai 已经从之前的远见者象限发展到领导者象限。它继续通过重大的商业扩张获得发展,并巩固其作为思想领袖和创新者的地位。

挑战者

  • MathWorks 仍然是一个挑战者,得益于它在高级分析领域的高知名度、庞大的装机量和强大的客户关系。然而,由于其对工程和高端财务场景的专注限制了其产品的前瞻性,还有一些客户对其评分也较低。
  • TIBCO 软件公司 (新入公司) 在 2017 年 6 月从 Quest Software 公司那里收购了著名的 Statistica 软件平台,从而进入了这个市场。2017 年 11 月,该公司还收购了 Alpine Data,这家公司 2017 年就处在 MQ 的远见者行列。对于执行能力,这次 MQ 仅评估 TIBCO Statistica 平台的能力。TIBCO 的其他收购只对其前瞻性产生影响。

远见者

IBM 提供了许多分析解决方案。对于这次的 MQ, Gartner 评估了 SPSS Modeler 和 SPSS Statistics,没有评估 Data Science Experience(DSX),因为它没有满足 Gartner 执行力轴的评估标准。

Gartner 点评:

IBM 现在处在远见者象限,与其他厂商相比,在产品前瞻性和执行能力方面都已经失去了优势。然而,IBM 的 DSX 具有激发更广泛且具有创新性的前瞻性产品的潜力。IBM 已经宣布计划在 2018 年为 SPSS 产品实现一个新的接口,以将 SPSS Modeler 完全集成到 DSX 中。

微软为数据科学和机器学习提供多种产品。对于云计算,产品包括 Azure 机器学习、Azure 数据工厂、Azure 流分析、Azure HDInsight、Azure Data Lake 和 Power BI。

对于 on-premises 计算,微软为 SQL Server 提供了机器学习服务 (在此次 MQ 的截止日期之后的 2017 年 9 月发布)。只有 Azure 机器学习工具全部满足了这次 MQ 包含的所有标准。

Gartner 点评:

微软仍然处在远见者象限。它这次的位置是由于市场反应能力和产品生存能力的低分造成的,因为 Azure 机器学习工具的云计算特性限制了许多高级分析场景的可用性,这些场景需要使用 on-premises 选项。

Domino (Domino Data Lab) 数据科学平台是专家数据科学团队的端到端解决方案。该平台的专注点是集成来自开源软件和专有工具生态系统的工具,以实现协作性、再现性以及模型开发和部署的集中化。Domino 虽然仍在远见者象限,但是它显著提高了执行力。

Gartner 点评:

Domino……在机器学习生命周期的开始阶段 (数据访问、数据准备、数据探索和可视化),执行能力虽然有所提高,但仍然被产品功能性问题拖了后腿。然而,在过去的一年里,Domino 充分展现了在竞争激烈的市场中赢得新客户和获得关注的能力。

Dataiku 提供 Data Science Studio (DSS) 产品,专注于跨学科协作和产品易用性。

Gartner 点评:

Dataiku 仍然在远见者象限……因为 DSS 能够使用户快速启动机器学习项目。它的产品前瞻性在于对协作和开源的支持,这也是它的产品路线图的重点。由于在场景用例方面的广度相对较差,以及自动化和数据流方面的不足,它的产品前瞻性得分低于之前的 MQ。

Databricks (新入公司) 在云产品中提供了基于 Apache spark 的 Databricks 统一分析平台。该产品还提供安全性、可靠性、操作化和性能方面的专有特性。

Gartner 点评:

Databricks 是这次魔力象限的新进入者。作为远见者,它借鉴了开源社区的经验并结合自己的 Spark 专业知识,为用户提供了一个易于访问且熟悉的平台。除了数据科学和机器学习之外,Databricks 还关注数据工程。2017 年获得 1.4 亿美元 D 轮融资,这为 Databricks 提供了丰富的资源,以扩展其部署选项并实现其愿景。

特定领域者

  • SAP 再次将其平台从 SAP 业务对象的预测分析改为简单的预测分析。它仍然是一个小众玩家,因为客户满意度低,缺乏思想共享,工具链碎片化,以及在云技术、深度学习和 Python 技术上的巨大差距。
  • Angoss 在 2018 年 1 月被 Datawatch 收购,但由于收购延迟,该报告收录的仍然是 Angoss。Angoss 拥有忠实的客户,但仍然是特定领域者,因为它仍然被认为是桌面环境的供应商。
  • Anaconda (新入公司) 提供 Anaconda Enterprise 5.0 产品,这是一个基于交互式笔记本概念的开源开发环境。它还提供了一个软件分发环境,通过它可以访问众多的开源开发环境和开源库。
  • Teradata 提供 Teradata 统一数据体系结构产品,这是一个结合了开源和商业技术来提供分析能力的企业分析生态系统。由于其在数据科学开发方面缺乏凝聚力和易用性,它仍然是一个特定领域者。

市场展望

Gartner 预计,未来两到三年内,数据科学和机器学习平台市场将继续出现动荡。全新的厂商,以及来自邻近领域市场的现有厂商 (如分析和 BI 公司),将继续进入该领域。例如,最近一次值得关注的收购案是在 2018 年 1 月 Datawatch 收购 Angoss。传统的厂商将努力变得更加敏捷和具有高响应性。我们预计厂商间将进行进一步的收购和扩展,以获得描述性、诊断性、预测性和规范性的分析能力。旨在解决特定的行业问题的应用型的分析解决方案,将继续提供高级的从内到外的全面分析方案。

总结

传统的数据科学和机器学习厂商正受到新进入者以及更小、更灵活的竞争对手的挑战,这些竞争者更容易适应环境,并且随着市场的发展能够更迅速的做出反应。其他供应商也在适应市场需求。例如,Amazon 和谷歌正在开发数据科学和机器学习平台。商业软件公司也进入了市场——例如,Salesforce 推出的 Einstein,Workday 收购的 Platfora。此外,传统上专注于传统描述性和诊断分析的厂商正在通过技术改进或收购来扩展他们的能力,以提供一系列的分析能力,其中不仅包括描述性分析和诊断分析,还包括预测性和规范性分析。收购能够使厂商增强他们的视野,扩大他们的能力,例如:DataRobot 收购的 Nutonian, Progress 收购 DataRPM, TIBCO 软件收购 Statistica(来自 Quest 软件的消息) 和 Alpine Data。

许多组织机构在等待新平台的到来,期望新平台能够帮助扩展现有的基础设施,并与其他现在技术良好融合。用户必须清楚这个市场的快速变化,并了解各厂商和其他组织机构是如何应对这些变化的。他们应该定期评估市场状况并评估当前供应商应对和适应这些变化的能力。此外,他们还应考虑将其分析能力扩展为具有内聚性的描述性、诊断性、预测性和规范性的能力。他们必须熟悉并评估新进入者和颠覆性供应商,以了解这些竞争对手的数据科学和机器学习技术的价值主张。在评估新的厂商和平台时,他们必须评估平台是否与自己已经部署的分析平台存在竞争或互补。此外,考虑从外部服务供应商那里获得帮助也是很好的途径。

随着数据科学和机器学习变得越来越普遍,拥有管理数据和分析数据的企业能力将变得越来越重要。不只是管理能力,在它的整个生命周期中运作和管理数据科学和机器学习模型的能力,在整个分析生命周期中协作和共享的能力,都变得越来越重要。到目前为止,这一领域还没有得到很多关注,但它正变得对组织机构的投资回报率最大化至关重要。

你可以从Domino、H2O.ai、 Alteryx、 Dataiku 以及其他上文提到的厂商处下载《Gartner 2018 数据科学和机器学习平台的魔力象限》报告。

你也可以阅读一篇相关的报告:《Gartner 2018 分析和商业智能平台的魔力象限》报告。

英文原文链接Gainers and Losers in Gartner 2018 Magic Quadrant for Data Science and Machine Learning Platforms