
Meetup 活动
ClickHouse Shenzhen User Group 第 2 届 Meetup 倒计时 2 天,报名从速,详见文末海报!
长安福特 CDP 平台介绍
长安福特数字化营销团队通过 CDP 平台实现了用户画像构建、数据分析、精准广告投放及人群圈选的全链路数字化管理。该平台整合多源数据资产,覆盖以下核心数据类型:
基础数据:客户与车辆的基础属性信息;
线下行为数据:维修记录、采购行为、到店频率、订单生成等线下场景数据;
线上行为数据:来自商城、微客服、APP 等私域渠道的用户互动行为,包括浏览轨迹、广告点击与转化、购买记录、社交媒体互动等细颗粒度行为埋点数据。
这些数据经过 Flink 和 Spark 的清洗后汇聚到宽表中进行存储,并用于支持后续的标签圈选、客户画像、归因分析等场景,辅助营销部门进行决策,同时生成实时看板和报表用于观察广告及其他营销行为的投放效果。

早期业务架构痛点
在 CDP 应用建设初期,长安福特选择了能够适配 Flink、kafka、Spark 等多源生态的 ClickHouse 社区版作为底层的数仓平台,、基于其 5 倍数据压缩率、万亿数据秒级分析的超高宽表查询性能,长安福特的 CDP 平台可以秒级处理标签圈选、客户画像、归因分析等复杂查询,形成实时看板和报表提供市场营销和售后部门使用。截止 2024 年,该 CDP 系统已经累积超百 TB 数据、为多个营销部门提供业务支持。
但随着业务的发展,长安福特基于自建 ClickHouse 社区版构建的 CDP 系统在成本管理、运维难度、系统稳定性上也开始面临一系列的技术挑战:
成本压力显著
存储成本:按照业务侧要求历史数据永久保留,7 年数据量累积已超百 TB,且需要永久在线,存储成本持续攀升。
计算成本:业务高峰时(每日 9-11 点报表任务)的资源需求是低峰时的 4 倍,自建 ClickHouse 固定规格集群按峰值采购资源,计算成本高,业务闲时资源浪费严重。
系统稳定性不足
突发查询易宕机:自建的固定规格集群在处理突发的离散大查询时频繁触发 OOM(内存溢出),影响稳定性,且问题随数据量增长和业务方增多而持续加剧。
运维复杂度高
弹性扩展困难:在新车发布等营销活动期间的数据量和查询需求有数十倍的增长,需手动调整分布式集群资源,操作耗时且流程复杂,难以快速响应业务需求。

升级阿里云 ClickHouse 企业版
为了解决上述问题,长安福特云团队联合数字化营销部门决定将阿里云 ClickHouse 企业版应用到当前的 CDP 业务上,替代原有的自建开源 ClickHouse。ClickHouse 企业版与社区版本的最大区别在于,它引入了更先进的存算分离架构和资源弹性 Serverless 能力,在 100%兼容同版本开源 ClickHouse 的同时,支持更高效的计算与存储资源管理,降低了大规模数据存储场景下的存储成本、水平扩缩容等运维场景对业务的影响时间和工作量,并通过 Serverless 提升了业务在突发高峰下的稳定性、降低了业务的闲时资源浪费。

存算分离架构是 ClickHouse 企业版的核心创新,它通过将计算资源和存储资源分开,极大地提高了系统的弹性和扩展性。在这种架构下,计算节点和存储节点独立扩展,存储资源可以通过共享存储 OSS 进行集中管理,而计算节点则能够根据负载情况进行自动伸缩,从而更好地应对流量高峰期的挑战。
企业版还引入了 Serverless 计算模型,允许平台根据实际负载自动调整计算资源的大小。相比于传统的基于固定资源分配的计算模式,Serverless 架构能帮助平台实现弹性伸缩,在需要时自动分配计算资源,极大地节省了资源开销,同时也能更好的应对业务流量的非预期增长,提高了系统的稳定性。
得益于阿里云 ClickHouse 企业版对同版本开源 ClickHouse 的 100%语法兼容性,长安福特在测试和迁移过程中,对业务和应用本身并不需要进行修改,只需要将历史数据从原有的自建集群迁移到企业版集群上即可。
业务价值
如图所示,在非营销活动期间,长安福特的集群资源水位呈现每日周期性波动。

阿里云 ClickHouse 企业版通过 Serverless 计算资源弹性技术,实现了业务负载与资源供给的动态匹配:
秒级弹性扩缩容:在业务高峰来临时,如营销活动、报表生成时段,系统可在数秒内完成计算资源的自动扩容,确保复杂查询与高并发请求的稳定响应;在业务低峰期,资源则自动缩减至最小化,避免资源闲置浪费。
成本精准控制:采用按需计费模式,仅对实际使用的资源量收费,结合弹性扩缩容机制,可使业务低峰时段的资源成本降低 70%以上。
性能稳定性保障:通过预配置的弹性阈值与智能调度算法,系统能自动识别业务波动趋势,确保即使在突发流量或复杂查询场景下,仍能维持数据处理的低延迟与高吞吐。
可以看到集群在业务的高峰和低谷时段都可以做到按照实际业务波动秒级扩缩容,避免持续高成本。这一机制帮助长安福特在 ClickHouse 企业版上的资源投入完美贴合业务曲线,大幅节省成本的同时保障了系统性能,并优化使用体验。
此外,在存储方面,由于企业版使用 OSS 作为底层的共享存储,在直接降低存储单价的同时,也提供了存储 Serverless 能力,可以按照实际的业务数据存储量计费,无需再为业务增长预购云盘,这也大大降低了存储的闲置,进一步降低存储成本。
总结与未来展望
升级至阿里云 ClickHouse 企业版后,长安福特实现了以下三大核心成效:
成本优化显著
资源投入降低 40%+:相比自建 ClickHouse 集群,企业版通过存算分离架构与弹性计费模式,使年度计算与存储成本直接减少 40%以上;
动态资源匹配业务曲线:高峰时段仅按需扩容,低峰期资源自动缩容,避免固定规格集群的资源浪费。
系统稳定性跃升
秒级弹性响应:业务高峰(如营销活动、日报生成)时,计算资源可在秒内完成自动扩容,保障复杂查询与高并发场景的稳定性;
故障率归零:上线半年内未发生 OOM 事故,突发大查询引发的系统波动风险大大降低。
运维效率大幅提升
分钟级资源调整:增删节点操作分钟级完成,且业务读写完全无感知,彻底解决营销高峰期前的运维压力;
托管服务降本增效:专业运维团队保障,营销团队可将人力资源从集群管理中释放,专注业务创新。
基于当前升级成果,长安福特计划通过阿里云 ClickHouse 企业版的弹性架构与托管能力,将售后分析、用户画像、供应链优化等场景数据迁移至平台,实现更精准的库存预测与客户行为分析,并以成本节省与稳定运行为基础,进一步释放数据价值,赋能业务创新。
了解更多
欢迎欢迎钉钉搜索群号:130735002817
/END/

征稿启示
面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出 &图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:Tracy.Wang@clickhouse.com。


评论