写点什么

宝马、Indeed 和 WHOOP 的降本增效实践:如何在 Lakehouse 上构建分析与 AI 能力 | 技术实践

  • 2026-02-12
    北京
  • 本文字数:2817 字

    阅读完需:约 9 分钟

2026 年,智能体将在企业级应用中取得哪些实质性突破?点击下载《2026 年 AI 与数据发展预测》白皮书,获悉专家一手前瞻,抢先拥抱新的工作方式!

数据可用性空前提高,企业却发现规模化交付可靠的分析与人工智能解决方案变得前所未有的困难。随着数据湖逐渐成为业务关键型分析与决策的共享基础平台,可靠性、并发处理能力及成本可预测性等方面的挑战迅速显现。

开放表格与数据格式部分缓解了这一难题。通过标准化数据存储与访问方式,Apache Iceberg 等格式使机构能够更有效地掌控数据,并为跨引擎的可互操作分析奠定基础。然而,仅靠开放性尚不足以解决复杂的分析困境。

随着数据分布于多云环境、各类数据目录及工具之中,众多团队依然难以交付符合业务预期的分析成果。性能调优、运维负担与碎片化的安全管理模型,常常横亘在原始数据与可靠洞察之间。

如今,越来越多的组织正以提升效率为目标重构其分析架构。将计算能力引向数据所在之处的核心理念,源于对开放存储中单一受治理数据副本的坚持——这使团队能专注于挖掘数据价值,而非反复迁移或复制数据集。

这里正孕育着一种全新的技术路径。它基于 Apache Iceberg 这类开放数据表格式构建,同时支持 Delta 等其他格式。Snowflake 将一套为企业关键工作负载设计的强大分析引擎,直接部署于数据原生位置。团队无需再将数据迁移至另一个独立系统,即可在其存储原址处理全量数据,同时确保性能、可靠性与成本可控性。

虽然这一路径在理念上令人振奋,但其在实践中的应用更具价值。本期综述将重点展示三大品牌——BMW Group、Indeed 与 WHOOP——如何运用该方案,在其全域数据资产中驱动分析与人工智能应用,从而将开放数据架构转化为可量化的商业成果。

从愿景到实践

Indeed 在扩大自助数据访问规模的同时降低成本 43%

Indeed 运营着一个 52PB 规模的数据湖,为全公司的关键业务报表、分析与实验提供支持。随着自助式数据访问(即读写 Apache Iceberg™ 表的能力)需求的增长,数据工程团队亟需一种既能扩展分析能力、又避免形成瓶颈的解决方案。

通过将数据湖从 Hive-ORC 架构迁移至 Apache Iceberg,Indeed 采用了与其开放数据战略相契合的“一次写入,随处读取”模式。借助 Snowflake 平台,分析人员能够直接读写 Iceberg 表,同时通过 Horizon 目录保持安全与治理控制,包括列级安全策略和数据脱敏机制。

在内部测试中,Indeed 发现,相比在同一环境中评估的其他分析引擎,使用 Snowflake 查询 Iceberg 表的成本降低了 43%–74%。这种开源格式、受控访问与高性能分析的结合,使得 Indeed 能够在为规模化构建的湖仓平台上,加速实验探索、产品分析与洞察生成。

凭借 Snowflake 对 Apache Iceberg 的原生支持,Indeed 将庞大的数据湖转变为受控的自助分析平台。

WHOOP 在提供实时健康洞察的同时大幅削减计算时间

WHOOP 每天通过其可穿戴设备分析数十亿条生物特征信号,为会员洞察、产品创新及业务预测提供支持。随着公司业务规模扩大,其需要一种在统一各系统数据的同时、能对敏感健康信息保持严格治理的方案。

通过将数据整合至 Snowflake 平台并采用 Apache Iceberg 技术,WHOOP 在借助 Horizon Catalog 保障数据安全的前提下,简化了数据访问与管理流程。公司发现其新一代 AI/ML 财务预测模型运行速度提升了 3 倍,且通过降低运维复杂性,团队每日可节省 20 小时的计算资源。

 

依托 Snowflake,WHOOP 将数据分析与人工智能转化为竞争优势,实现了更快速的财务预测能力,并为会员提供了更具个性化的体验。

宝马集团利用全球数据洞察连接万名用户,同时提升效率 25%

宝马集团通过其云数据枢纽(Cloud Data Hub)运营着一个大规模的全球数据环境,整合了集团内制造、服务、供应链及可持续发展等多类业务场景的数据。该平台涵盖 15 个业务领域、超过 6,000 个数据集,每月服务用户数超 10,000 名,在规模化运营中需兼顾架构灵活性与统一治理规范。

为支撑这一“最佳架构”体系,宝马采用 Apache Iceberg 并结合 AWS 原生工具来管理开放、分布式数据;同时,在需要高效可靠分析的场景中集成 Snowflake 平台。Snowflake 为宝马现有数据资产提供了高性能计算能力,可在不干扰既有系统或不必要复制数据的前提下,实现复杂的运营分析。

这一策略已取得显著成效。

 

宝马集团报告称,在某些服务类数据工作负载上平均节省了 25%的成本,并已在 Snowflake 平台上部署超过 60 个数据应用场景,帮助各团队更快获取业务洞察,同时确保跨地区、跨工作负载的数据治理一致性。

从复杂走向清晰

尽管宝马集团(BMW Group)、Indeed 与 WHOOP 面临的具体挑战各异,但其应对策略背后存在一个共同模式:它们均优先采用将工具引入数据的策略,以保障架构效率,维持统一、开放、受治理的数据基座。向 Apache Iceberg 等开放表格式的转型使这一模式成为可能,这些格式提供了管理大规模数据所需的结构化、一致性与互操作性。而 Snowflake 则在此基础上提供了关键补充:一个能够直接在上述开放数据上运行的可靠分析与 AI 引擎,其内置功能旨在帮助团队在规模扩展时管理并发与成本。

这些企业并未选择拼接多个计算引擎与治理层,而是通过将 Snowflake 引入其数据环境,与 Snowflake 平台上的既有工作形成互补。它们基于存储在 Snowflake 中、无需移动的开放数据,直接部署了统一且强大的分析引擎,覆盖整个数据资产。这一转变使得它们能够加速创新、简化运营,并在无需重构数据平台的前提下,交付可信的分析与 AI 能力。

在上述案例中,三个核心架构原则始终贯穿其中:

  • 就地访问数据:直接在各处数据存储位置进行处理——无论是 Iceberg 表、Delta 表还是 Parquet 文件,无需迁移或复制数据;

  • 实现规模化高性能:在业务量增长时,以稳定可靠的性能支持高并发关键业务负载,确保性能表现可预测;

  • 统一分析与人工智能:通过统一的分析平台,赋能全组织各团队优化决策流程,打破数据孤岛。

Snowflake 并未取代这些机构的开放架构体系,而是为其数据提供了所需的性能与可靠性,从而化解了开放性与运营稳定性之间的取舍难题。它帮助 WHOOP 达成服务等级协议(SLA)、助力 BMW 降低成本,并提升了 Indeed 数据团队的价值产出。

以下能力展示各团队如何在不改变数据存储位置的前提下,为开放数据体系引入生产级分析引擎。

更便捷地运行分析功能与人工智能,无论您的数据位于何处

在组织探索架构效率的今天,一个共识正逐渐成形:与其在系统间迁移数据,不如将数据作为单一受治理副本留存,并将分析引擎与人工智能引擎部署至数据所在之处。Snowflake 提供统一的引擎与世界一流的平台,助力企业将这些数据转化为可信的分析洞察与人工智能应用。BMW、Indeed 和 WHOOP 等案例展示了不同行业如何借助这一架构,实现更快决策、更强治理控制与更高效运营。

您的数据已准备就绪。现在,是时候让它们发挥价值了。

原文地址:https://www.snowflake.com/en/blog/bringing-ai-analytics-lakehouses/

点击链接立即报名注册:Ascent - Snowflake Platform Training - China更多 Snowflake 精彩活动请关注专区