写点什么

长安福特引入阿里云 ClickHouse 构建 CDP 平台,降本 40% 实现精准营销

ClickHouse

  • 2025-09-11
    北京
  • 本文字数:2607 字

    阅读完需:约 9 分钟

大小:1.64M时长:09:32
长安福特引入阿里云ClickHouse构建CDP平台,降本40%实现精准营销

Meetup 活动

ClickHouse Shenzhen User Group 第 2 届 Meetup 倒计时 2 天,报名从速,详见文末海报!

长安福特 CDP 平台介绍


长安福特数字化营销团队通过 CDP 平台实现了用户画像构建、数据分析、精准广告投放及人群圈选的全链路数字化管理。该平台整合多源数据资产,覆盖以下核心数据类型:


  • 基础数据:客户与车辆的基础属性信息;

  • 线下行为数据:维修记录、采购行为、到店频率、订单生成等线下场景数据;

  • 线上行为数据:来自商城、微客服、APP 等私域渠道的用户互动行为,包括浏览轨迹、广告点击与转化、购买记录、社交媒体互动等细颗粒度行为埋点数据。


这些数据经过 Flink 和 Spark 的清洗后汇聚到宽表中进行存储,并用于支持后续的标签圈选、客户画像、归因分析等场景,辅助营销部门进行决策,同时生成实时看板和报表用于观察广告及其他营销行为的投放效果。


早期业务架构痛点


在 CDP 应用建设初期,长安福特选择了能够适配 Flink、kafka、Spark 等多源生态的 ClickHouse 社区版作为底层的数仓平台,、基于其 5 倍数据压缩率、万亿数据秒级分析的超高宽表查询性能,长安福特的 CDP 平台可以秒级处理标签圈选、客户画像、归因分析等复杂查询,形成实时看板和报表提供市场营销和售后部门使用。截止 2024 年,该 CDP 系统已经累积超百 TB 数据、为多个营销部门提供业务支持。


但随着业务的发展,长安福特基于自建 ClickHouse 社区版构建的 CDP 系统在成本管理、运维难度、系统稳定性上也开始面临一系列的技术挑战:


  1. 成本压力显著

    存储成本:按照业务侧要求历史数据永久保留,7 年数据量累积已超百 TB,且需要永久在线,存储成本持续攀升。

    计算成本:业务高峰时(每日 9-11 点报表任务)的资源需求是低峰时的 4 倍,自建 ClickHouse 固定规格集群按峰值采购资源,计算成本高,业务闲时资源浪费严重。

  2. 系统稳定性不足

    突发查询易宕机:自建的固定规格集群在处理突发的离散大查询时频繁触发 OOM(内存溢出),影响稳定性,且问题随数据量增长和业务方增多而持续加剧。

  3. 运维复杂度高

    弹性扩展困难:在新车发布等营销活动期间的数据量和查询需求有数十倍的增长,需手动调整分布式集群资源,操作耗时且流程复杂,难以快速响应业务需求。


升级阿里云 ClickHouse 企业版


为了解决上述问题,长安福特云团队联合数字化营销部门决定将阿里云 ClickHouse 企业版应用到当前的 CDP 业务上,替代原有的自建开源 ClickHouse。ClickHouse 企业版与社区版本的最大区别在于,它引入了更先进的存算分离架构和资源弹性 Serverless 能力,在 100%兼容同版本开源 ClickHouse 的同时,支持更高效的计算与存储资源管理,降低了大规模数据存储场景下的存储成本、水平扩缩容等运维场景对业务的影响时间和工作量,并通过 Serverless 提升了业务在突发高峰下的稳定性、降低了业务的闲时资源浪费。


存算分离架构是 ClickHouse 企业版的核心创新,它通过将计算资源和存储资源分开,极大地提高了系统的弹性和扩展性。在这种架构下,计算节点和存储节点独立扩展,存储资源可以通过共享存储 OSS 进行集中管理,而计算节点则能够根据负载情况进行自动伸缩,从而更好地应对流量高峰期的挑战。


企业版还引入了 Serverless 计算模型,允许平台根据实际负载自动调整计算资源的大小。相比于传统的基于固定资源分配的计算模式,Serverless 架构能帮助平台实现弹性伸缩,在需要时自动分配计算资源,极大地节省了资源开销,同时也能更好的应对业务流量的非预期增长,提高了系统的稳定性。


得益于阿里云 ClickHouse 企业版对同版本开源 ClickHouse 的 100%语法兼容性,长安福特在测试和迁移过程中,对业务和应用本身并不需要进行修改,只需要将历史数据从原有的自建集群迁移到企业版集群上即可。

业务价值


如图所示,在非营销活动期间,长安福特的集群资源水位呈现每日周期性波动。



阿里云 ClickHouse 企业版通过 Serverless 计算资源弹性技术,实现了业务负载与资源供给的动态匹配:


  1. 秒级弹性扩缩容:在业务高峰来临时,如营销活动、报表生成时段,系统可在数秒内完成计算资源的自动扩容,确保复杂查询与高并发请求的稳定响应;在业务低峰期,资源则自动缩减至最小化,避免资源闲置浪费。

  2. 成本精准控制:采用按需计费模式,仅对实际使用的资源量收费,结合弹性扩缩容机制,可使业务低峰时段的资源成本降低 70%以上。

  3. 性能稳定性保障:通过预配置的弹性阈值与智能调度算法,系统能自动识别业务波动趋势,确保即使在突发流量或复杂查询场景下,仍能维持数据处理的低延迟与高吞吐。


可以看到集群在业务的高峰和低谷时段都可以做到按照实际业务波动秒级扩缩容,避免持续高成本。这一机制帮助长安福特在 ClickHouse 企业版上的资源投入完美贴合业务曲线,大幅节省成本的同时保障了系统性能,并优化使用体验。


此外,在存储方面,由于企业版使用 OSS 作为底层的共享存储,在直接降低存储单价的同时,也提供了存储 Serverless 能力,可以按照实际的业务数据存储量计费,无需再为业务增长预购云盘,这也大大降低了存储的闲置,进一步降低存储成本。

总结与未来展望


升级至阿里云 ClickHouse 企业版后,长安福特实现了以下三大核心成效:


  1. 成本优化显著

    资源投入降低 40%+:相比自建 ClickHouse 集群,企业版通过存算分离架构与弹性计费模式,使年度计算与存储成本直接减少 40%以上;

    动态资源匹配业务曲线:高峰时段仅按需扩容,低峰期资源自动缩容,避免固定规格集群的资源浪费。

  2. 系统稳定性跃升

    秒级弹性响应:业务高峰(如营销活动、日报生成)时,计算资源可在秒内完成自动扩容,保障复杂查询与高并发场景的稳定性;

    故障率归零:上线半年内未发生 OOM 事故,突发大查询引发的系统波动风险大大降低。

  3. 运维效率大幅提升

    分钟级资源调整:增删节点操作分钟级完成,且业务读写完全无感知,彻底解决营销高峰期前的运维压力;

    托管服务降本增效:专业运维团队保障,营销团队可将人力资源从集群管理中释放,专注业务创新。

基于当前升级成果,长安福特计划通过阿里云 ClickHouse 企业版的弹性架构与托管能力,将售后分析、用户画像、供应链优化等场景数据迁移至平台,实现更精准的库存预测与客户行为分析,并以成本节省与稳定运行为基础,进一步释放数据价值,赋能业务创新。


了解更多

欢迎欢迎钉钉搜索群号:130735002817


/END/


征稿启示


面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出 &图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:Tracy.Wang@clickhouse.com。




2025-09-11 10:552343

评论

发布
暂无评论

凝创新技术,汇数字力量 欧特克数字赋能『智』造汽车高峰论坛在沪开幕

E科讯

AITO问界M9工信部申报信息曝光,或将是理想L9的最大对手?

极客天地

打败传统Scada系统的Web Scada是什么?

2D3D前端可视化开发

物联网 组态软件 工业控制 web scada scada系统

2023-09-13:用go语言,给定一个整数数组 nums 和一个正整数 k, 找出是否有可能把这个数组分成 k 个非空子集,其总和都相等。 输入: nums = [4, 3, 2, 3, 5,

福大大架构师每日一题

福大大架构师每日一题

ARTS 打卡 第二周,按部就班

三掌柜

ARTS 打卡计划

ARTS 打卡 第三周,渐入佳境

三掌柜

ARTS 打卡计划

【Y 新闻】YMatrix 成立三周年,三岁的我们还真是“不简单”

YMatrix 超融合数据库

数据库 超融合数据库 YMatrix

财税一体,高效合规,用数据引领中企出海价值创造

用友BIP

中企出海

AI时代,企业如何做好数智化合同管理?

用友BIP

数智合同

推动长期成功:NFT 推广机构如何制定可持续战略

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 链游开发 NFT开发

无代码编程时代的到来:新兴工具和平台的前瞻展望

互联网工科生

低代码 数据可视化 JNPF

Docker和Kubernetes:各自的优势和适用场景

树上有只程序猿

Docker Kubernetes

《玩转鲲鹏DevKit系列》第四期:如何基于鲲鹏平台高效开发?

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号9月PK榜

Flink TaskManager 内存管理机制介绍与调优总结

腾讯云大数据

flink

每一座屎山代码背后,都藏着一堆熟读代码规范的研发

CODING DevOps

分布式锁的三种实现方式!

树上有只程序猿

乐观锁 悲观锁 分布式锁

拒做职场小白,如何入职就成为成熟工程师

小魏写代码

求职面试 就业辅导

MySQL表设计实践

天高任鸟飞

MySQL

百度智能云与蓝色光标共绘AI营销新篇章:袁佛玉亮相Blue AI行业模型发布会,千帆平台引领行业模型创新之路

极客天地

解锁 Postman 接口测试:完整指南

Liam

Java 程序员 Postman 接口测试 测试工具

你知道Golang的模板怎么用吗?带你了解动态文本的生成!

王中阳Go

长安福特引入阿里云ClickHouse构建CDP平台,降本40%实现精准营销_DataOps_InfoQ精选文章