写点什么

长安福特引入阿里云 ClickHouse 构建 CDP 平台,降本 40% 实现精准营销

ClickHouse

  • 2025-09-11
    北京
  • 本文字数:2607 字

    阅读完需:约 9 分钟

大小:1.64M时长:09:32
长安福特引入阿里云ClickHouse构建CDP平台,降本40%实现精准营销

Meetup 活动

ClickHouse Shenzhen User Group 第 2 届 Meetup 倒计时 2 天,报名从速,详见文末海报!

长安福特 CDP 平台介绍


长安福特数字化营销团队通过 CDP 平台实现了用户画像构建、数据分析、精准广告投放及人群圈选的全链路数字化管理。该平台整合多源数据资产,覆盖以下核心数据类型:


  • 基础数据:客户与车辆的基础属性信息;

  • 线下行为数据:维修记录、采购行为、到店频率、订单生成等线下场景数据;

  • 线上行为数据:来自商城、微客服、APP 等私域渠道的用户互动行为,包括浏览轨迹、广告点击与转化、购买记录、社交媒体互动等细颗粒度行为埋点数据。


这些数据经过 Flink 和 Spark 的清洗后汇聚到宽表中进行存储,并用于支持后续的标签圈选、客户画像、归因分析等场景,辅助营销部门进行决策,同时生成实时看板和报表用于观察广告及其他营销行为的投放效果。


早期业务架构痛点


在 CDP 应用建设初期,长安福特选择了能够适配 Flink、kafka、Spark 等多源生态的 ClickHouse 社区版作为底层的数仓平台,、基于其 5 倍数据压缩率、万亿数据秒级分析的超高宽表查询性能,长安福特的 CDP 平台可以秒级处理标签圈选、客户画像、归因分析等复杂查询,形成实时看板和报表提供市场营销和售后部门使用。截止 2024 年,该 CDP 系统已经累积超百 TB 数据、为多个营销部门提供业务支持。


但随着业务的发展,长安福特基于自建 ClickHouse 社区版构建的 CDP 系统在成本管理、运维难度、系统稳定性上也开始面临一系列的技术挑战:


  1. 成本压力显著

    存储成本:按照业务侧要求历史数据永久保留,7 年数据量累积已超百 TB,且需要永久在线,存储成本持续攀升。

    计算成本:业务高峰时(每日 9-11 点报表任务)的资源需求是低峰时的 4 倍,自建 ClickHouse 固定规格集群按峰值采购资源,计算成本高,业务闲时资源浪费严重。

  2. 系统稳定性不足

    突发查询易宕机:自建的固定规格集群在处理突发的离散大查询时频繁触发 OOM(内存溢出),影响稳定性,且问题随数据量增长和业务方增多而持续加剧。

  3. 运维复杂度高

    弹性扩展困难:在新车发布等营销活动期间的数据量和查询需求有数十倍的增长,需手动调整分布式集群资源,操作耗时且流程复杂,难以快速响应业务需求。


升级阿里云 ClickHouse 企业版


为了解决上述问题,长安福特云团队联合数字化营销部门决定将阿里云 ClickHouse 企业版应用到当前的 CDP 业务上,替代原有的自建开源 ClickHouse。ClickHouse 企业版与社区版本的最大区别在于,它引入了更先进的存算分离架构和资源弹性 Serverless 能力,在 100%兼容同版本开源 ClickHouse 的同时,支持更高效的计算与存储资源管理,降低了大规模数据存储场景下的存储成本、水平扩缩容等运维场景对业务的影响时间和工作量,并通过 Serverless 提升了业务在突发高峰下的稳定性、降低了业务的闲时资源浪费。


存算分离架构是 ClickHouse 企业版的核心创新,它通过将计算资源和存储资源分开,极大地提高了系统的弹性和扩展性。在这种架构下,计算节点和存储节点独立扩展,存储资源可以通过共享存储 OSS 进行集中管理,而计算节点则能够根据负载情况进行自动伸缩,从而更好地应对流量高峰期的挑战。


企业版还引入了 Serverless 计算模型,允许平台根据实际负载自动调整计算资源的大小。相比于传统的基于固定资源分配的计算模式,Serverless 架构能帮助平台实现弹性伸缩,在需要时自动分配计算资源,极大地节省了资源开销,同时也能更好的应对业务流量的非预期增长,提高了系统的稳定性。


得益于阿里云 ClickHouse 企业版对同版本开源 ClickHouse 的 100%语法兼容性,长安福特在测试和迁移过程中,对业务和应用本身并不需要进行修改,只需要将历史数据从原有的自建集群迁移到企业版集群上即可。

业务价值


如图所示,在非营销活动期间,长安福特的集群资源水位呈现每日周期性波动。



阿里云 ClickHouse 企业版通过 Serverless 计算资源弹性技术,实现了业务负载与资源供给的动态匹配:


  1. 秒级弹性扩缩容:在业务高峰来临时,如营销活动、报表生成时段,系统可在数秒内完成计算资源的自动扩容,确保复杂查询与高并发请求的稳定响应;在业务低峰期,资源则自动缩减至最小化,避免资源闲置浪费。

  2. 成本精准控制:采用按需计费模式,仅对实际使用的资源量收费,结合弹性扩缩容机制,可使业务低峰时段的资源成本降低 70%以上。

  3. 性能稳定性保障:通过预配置的弹性阈值与智能调度算法,系统能自动识别业务波动趋势,确保即使在突发流量或复杂查询场景下,仍能维持数据处理的低延迟与高吞吐。


可以看到集群在业务的高峰和低谷时段都可以做到按照实际业务波动秒级扩缩容,避免持续高成本。这一机制帮助长安福特在 ClickHouse 企业版上的资源投入完美贴合业务曲线,大幅节省成本的同时保障了系统性能,并优化使用体验。


此外,在存储方面,由于企业版使用 OSS 作为底层的共享存储,在直接降低存储单价的同时,也提供了存储 Serverless 能力,可以按照实际的业务数据存储量计费,无需再为业务增长预购云盘,这也大大降低了存储的闲置,进一步降低存储成本。

总结与未来展望


升级至阿里云 ClickHouse 企业版后,长安福特实现了以下三大核心成效:


  1. 成本优化显著

    资源投入降低 40%+:相比自建 ClickHouse 集群,企业版通过存算分离架构与弹性计费模式,使年度计算与存储成本直接减少 40%以上;

    动态资源匹配业务曲线:高峰时段仅按需扩容,低峰期资源自动缩容,避免固定规格集群的资源浪费。

  2. 系统稳定性跃升

    秒级弹性响应:业务高峰(如营销活动、日报生成)时,计算资源可在秒内完成自动扩容,保障复杂查询与高并发场景的稳定性;

    故障率归零:上线半年内未发生 OOM 事故,突发大查询引发的系统波动风险大大降低。

  3. 运维效率大幅提升

    分钟级资源调整:增删节点操作分钟级完成,且业务读写完全无感知,彻底解决营销高峰期前的运维压力;

    托管服务降本增效:专业运维团队保障,营销团队可将人力资源从集群管理中释放,专注业务创新。

基于当前升级成果,长安福特计划通过阿里云 ClickHouse 企业版的弹性架构与托管能力,将售后分析、用户画像、供应链优化等场景数据迁移至平台,实现更精准的库存预测与客户行为分析,并以成本节省与稳定运行为基础,进一步释放数据价值,赋能业务创新。


了解更多

欢迎欢迎钉钉搜索群号:130735002817


/END/


征稿启示


面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出 &图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:Tracy.Wang@clickhouse.com。




2025-09-11 10:556132

评论

发布
暂无评论

极客时间运维进阶训练营第四周作业

Starry

C++学习---类型萃取---std::integral_constant

桑榆

C++ STL 11月月更

react源码中的生命周期和事件系统

flyzz177

React

centos安装python3/pip3项目所需的第三方模块(在线安装&&离线安装)

A-刘晨阳

Linux 运维 Python3 11月月更 pip3

react源码分析:babel如何解析jsx

flyzz177

React

云小课|云小课带您快速了解LTS可视化查看

华为云开发者联盟

云计算 后端 华为云

【web 开发基础】PHP 自定义常规函数的声明及应用 (30)

迷彩

函数 PHP基础 11月月更 自定义函数 常规参数函数

从React源码角度看useCallback,useMemo,useContext

goClient1992

React

从React源码来学hooks是不是更香呢

goClient1992

React

大数据分析如何进行?瓴羊Quick BI成为了很重要的工具

小偏执o

Centos7安装Mysql5.7(超详细版)

A-刘晨阳

MySQL Linux 运维 11月月更

【Linux】之【CPU】相关的命令及解析[lscpu、mpstat]

A-刘晨阳

Linux 运维 cpu 命令 11月月更

ERP 实施,甲方公司前期应该准备什么?

SAP虾客

学会二阶思维,你就能像巴菲特一样思考了

华为云开发者联盟

软件开发 开发 华为云 二阶思维

开源共建 | 中国移动冯江涛:ChunJun(原FlinkX)在数据入湖中的应用

袋鼠云数栈

flink 开源

桌面端软件的开发框架如何选型

Onegun

macos windows 桌面端 桌面应用

5种典型 API 攻击及预防建议

SEAL安全

API API安全

聊聊如何让办公网络直连Kubernetes集群PodIP/ClusterIP/Service DNS等

大卡尔

#Kubernetes# 工程效能 11月月更

从 Redux 的困扰到如何技术选型

光毅

JavaScript React Redux

那些适用于跨境电商的ERP系统

SAP虾客

混合开发Hybrid App的优劣

Onegun

ios 混合应用开发 移动端 andiod 混合开发

安卓??传奇!!探寻世界最大操作系统的崛起之路

博文视点Broadview

react源码分析:实现react时间分片

flyzz177

React

SAP ERP系统里的那些核心主数据

SAP虾客

Karmada跨集群优雅故障迁移特性解析

华为云开发者联盟

云原生 后端 华为云

与时俱进「风险系统保障质量之路」非同寻常

京东科技开发者

自动化 风险识别 风险控制 预警监控 风险系统

从React源码分析看useEffect

goClient1992

React

你可见过如此细致的延时任务详解

骑牛上青山

Java redis kafka 延时队列

ERP系统能给企业带来的那些好处

SAP虾客

算法基础:区间合并算法及模板应用

timerring

11月月更 区间合并 算法学习

高并发下丢失更新的解决方案

京东科技开发者

幻读 脏读 不可重复读 更新丢失

长安福特引入阿里云ClickHouse构建CDP平台,降本40%实现精准营销_DataOps_InfoQ精选文章