写点什么

长安福特引入阿里云 ClickHouse 构建 CDP 平台,降本 40% 实现精准营销

ClickHouse

  • 2025-09-11
    北京
  • 本文字数:2607 字

    阅读完需:约 9 分钟

大小:1.64M时长:09:32
长安福特引入阿里云ClickHouse构建CDP平台,降本40%实现精准营销

Meetup 活动

ClickHouse Shenzhen User Group 第 2 届 Meetup 倒计时 2 天,报名从速,详见文末海报!

长安福特 CDP 平台介绍


长安福特数字化营销团队通过 CDP 平台实现了用户画像构建、数据分析、精准广告投放及人群圈选的全链路数字化管理。该平台整合多源数据资产,覆盖以下核心数据类型:


  • 基础数据:客户与车辆的基础属性信息;

  • 线下行为数据:维修记录、采购行为、到店频率、订单生成等线下场景数据;

  • 线上行为数据:来自商城、微客服、APP 等私域渠道的用户互动行为,包括浏览轨迹、广告点击与转化、购买记录、社交媒体互动等细颗粒度行为埋点数据。


这些数据经过 Flink 和 Spark 的清洗后汇聚到宽表中进行存储,并用于支持后续的标签圈选、客户画像、归因分析等场景,辅助营销部门进行决策,同时生成实时看板和报表用于观察广告及其他营销行为的投放效果。


早期业务架构痛点


在 CDP 应用建设初期,长安福特选择了能够适配 Flink、kafka、Spark 等多源生态的 ClickHouse 社区版作为底层的数仓平台,、基于其 5 倍数据压缩率、万亿数据秒级分析的超高宽表查询性能,长安福特的 CDP 平台可以秒级处理标签圈选、客户画像、归因分析等复杂查询,形成实时看板和报表提供市场营销和售后部门使用。截止 2024 年,该 CDP 系统已经累积超百 TB 数据、为多个营销部门提供业务支持。


但随着业务的发展,长安福特基于自建 ClickHouse 社区版构建的 CDP 系统在成本管理、运维难度、系统稳定性上也开始面临一系列的技术挑战:


  1. 成本压力显著

    存储成本:按照业务侧要求历史数据永久保留,7 年数据量累积已超百 TB,且需要永久在线,存储成本持续攀升。

    计算成本:业务高峰时(每日 9-11 点报表任务)的资源需求是低峰时的 4 倍,自建 ClickHouse 固定规格集群按峰值采购资源,计算成本高,业务闲时资源浪费严重。

  2. 系统稳定性不足

    突发查询易宕机:自建的固定规格集群在处理突发的离散大查询时频繁触发 OOM(内存溢出),影响稳定性,且问题随数据量增长和业务方增多而持续加剧。

  3. 运维复杂度高

    弹性扩展困难:在新车发布等营销活动期间的数据量和查询需求有数十倍的增长,需手动调整分布式集群资源,操作耗时且流程复杂,难以快速响应业务需求。


升级阿里云 ClickHouse 企业版


为了解决上述问题,长安福特云团队联合数字化营销部门决定将阿里云 ClickHouse 企业版应用到当前的 CDP 业务上,替代原有的自建开源 ClickHouse。ClickHouse 企业版与社区版本的最大区别在于,它引入了更先进的存算分离架构和资源弹性 Serverless 能力,在 100%兼容同版本开源 ClickHouse 的同时,支持更高效的计算与存储资源管理,降低了大规模数据存储场景下的存储成本、水平扩缩容等运维场景对业务的影响时间和工作量,并通过 Serverless 提升了业务在突发高峰下的稳定性、降低了业务的闲时资源浪费。


存算分离架构是 ClickHouse 企业版的核心创新,它通过将计算资源和存储资源分开,极大地提高了系统的弹性和扩展性。在这种架构下,计算节点和存储节点独立扩展,存储资源可以通过共享存储 OSS 进行集中管理,而计算节点则能够根据负载情况进行自动伸缩,从而更好地应对流量高峰期的挑战。


企业版还引入了 Serverless 计算模型,允许平台根据实际负载自动调整计算资源的大小。相比于传统的基于固定资源分配的计算模式,Serverless 架构能帮助平台实现弹性伸缩,在需要时自动分配计算资源,极大地节省了资源开销,同时也能更好的应对业务流量的非预期增长,提高了系统的稳定性。


得益于阿里云 ClickHouse 企业版对同版本开源 ClickHouse 的 100%语法兼容性,长安福特在测试和迁移过程中,对业务和应用本身并不需要进行修改,只需要将历史数据从原有的自建集群迁移到企业版集群上即可。

业务价值


如图所示,在非营销活动期间,长安福特的集群资源水位呈现每日周期性波动。



阿里云 ClickHouse 企业版通过 Serverless 计算资源弹性技术,实现了业务负载与资源供给的动态匹配:


  1. 秒级弹性扩缩容:在业务高峰来临时,如营销活动、报表生成时段,系统可在数秒内完成计算资源的自动扩容,确保复杂查询与高并发请求的稳定响应;在业务低峰期,资源则自动缩减至最小化,避免资源闲置浪费。

  2. 成本精准控制:采用按需计费模式,仅对实际使用的资源量收费,结合弹性扩缩容机制,可使业务低峰时段的资源成本降低 70%以上。

  3. 性能稳定性保障:通过预配置的弹性阈值与智能调度算法,系统能自动识别业务波动趋势,确保即使在突发流量或复杂查询场景下,仍能维持数据处理的低延迟与高吞吐。


可以看到集群在业务的高峰和低谷时段都可以做到按照实际业务波动秒级扩缩容,避免持续高成本。这一机制帮助长安福特在 ClickHouse 企业版上的资源投入完美贴合业务曲线,大幅节省成本的同时保障了系统性能,并优化使用体验。


此外,在存储方面,由于企业版使用 OSS 作为底层的共享存储,在直接降低存储单价的同时,也提供了存储 Serverless 能力,可以按照实际的业务数据存储量计费,无需再为业务增长预购云盘,这也大大降低了存储的闲置,进一步降低存储成本。

总结与未来展望


升级至阿里云 ClickHouse 企业版后,长安福特实现了以下三大核心成效:


  1. 成本优化显著

    资源投入降低 40%+:相比自建 ClickHouse 集群,企业版通过存算分离架构与弹性计费模式,使年度计算与存储成本直接减少 40%以上;

    动态资源匹配业务曲线:高峰时段仅按需扩容,低峰期资源自动缩容,避免固定规格集群的资源浪费。

  2. 系统稳定性跃升

    秒级弹性响应:业务高峰(如营销活动、日报生成)时,计算资源可在秒内完成自动扩容,保障复杂查询与高并发场景的稳定性;

    故障率归零:上线半年内未发生 OOM 事故,突发大查询引发的系统波动风险大大降低。

  3. 运维效率大幅提升

    分钟级资源调整:增删节点操作分钟级完成,且业务读写完全无感知,彻底解决营销高峰期前的运维压力;

    托管服务降本增效:专业运维团队保障,营销团队可将人力资源从集群管理中释放,专注业务创新。

基于当前升级成果,长安福特计划通过阿里云 ClickHouse 企业版的弹性架构与托管能力,将售后分析、用户画像、供应链优化等场景数据迁移至平台,实现更精准的库存预测与客户行为分析,并以成本节省与稳定运行为基础,进一步释放数据价值,赋能业务创新。


了解更多

欢迎欢迎钉钉搜索群号:130735002817


/END/


征稿启示


面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出 &图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:Tracy.Wang@clickhouse.com。




2025-09-11 10:555847

评论

发布
暂无评论

云原生之 Ansible 篇(一)

看,未来

云原生

Flutter使用自定义字体

坚果

6月月更

共享主机和 WordPress 主机之间的区别

海拥(haiyong.site)

6月月更

C#入门系列(三) -- 数据类型

陈言必行

C# 6月月更

SpringBoot下用Kyro作为Redis序列化工具

程序员欣宸

Java 6月月更 Kyro

SDN系统方法 | 2. 用例

俞凡

架构 网络 sdn SDN系统方法

[go] 后台管理数据权限控制实现 (无业务修改)

林逸民

Javascript中的垃圾回收

大熊G

JavaScript 前端 6月月更

迷宫问题java(DFS,回溯法,递归)

写代码两年半

DFS 迷宫 javase 回溯算法 6月月更

在线人民币数字金额转成美元金额大写工具

入门小站

工具

在线HTML转JADE工具

入门小站

工具

【愚公系列】2022年06月 二十三种设计模式(二十一)-策略模式(Stragety Pattern)

愚公搬代码

6月月更

linux之yum下载rpm包离线安装

入门小站

Linux

RTP与RTCP协议简述

穿过生命散发芬芳

rtp/rtcp 6月月更

在 CloudIDE 里实现天猫精灵自定义技能的业务逻辑

汪子熙

人工智能 机器学习 机器人 Cloud 6月月更

ElasticSearch部署架构和容量规划

IT巅峰技术

UNet语义分割实战:使用UNet实现对人物的抠图

AI浩

图像分割 6月月更

透过华为军团看科技之变(一):广域网络

脑极体

Docker下RabbitMQ延时队列实战两部曲之二:细说开发

程序员欣宸

Java RabbitMQ RabbitMQ延时队列 6月月更

15 个用于创建漂亮图表的 JavaScript 库

devpoint

eCharts D3 plotly 图表库 6月月更

Python爬虫基础-requests模块-1

zyf

6月月更

云原生之 Ansible 篇(二)

看,未来

云原生

vue-cli3项目目录结构介绍

小恺

6月月更

Fabric.js 上标和下标的使用偏方🔥

德育处主任

Web canvas 前端可视化 Fabric.js 6月月更

数据库每日一题---第1天:超过经理收入的员工

知心宝贝

数据库 算法 前端 后端 6月月更

生态对对碰丨详解 Flink CDC+OceanBase 全增量一体化数据集成方案

OceanBase 数据库

数据库 oceanbase Flink CDC

OceanBase 源码解读(十二):事务日志的提交和回放

OceanBase 数据库

oceanbase 源码解读

InfoQ 极客传媒 15 周年庆征文|分布式系统解决之道:目录、消息队列、事务系统及其他

No Silver Bullet

分布式系统 消息队列 6月月更 事务系统 InfoQ极客传媒15周年庆

【LeetCode】统计一个数组中好对子的数目Java题解

Albert

LeetCode 6月月更

【Spring 学习笔记(二)】Spring Bean 配置方式 与Spring Bean实例化

倔强的牛角

6月月更

通过知识图谱看端午节

清林情报分析师

数据分析 数据可视化 端午节 数据分析师 知识图谱

长安福特引入阿里云ClickHouse构建CDP平台,降本40%实现精准营销_DataOps_InfoQ精选文章