2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

你真的懂用户画像吗?

  • 2019-03-05
  • 本文字数:2314 字

    阅读完需:约 8 分钟

你真的懂用户画像吗?

在移动互联网时代,精细化运营成为企业重要的竞争力,此时,“用户画像”的概念也应运而生。用户画像是指,在大数据时代,我们通过对海量数字信息进行清洗、聚类、分析,从而将数据抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。在下文中,我们将以个推用户画像产品为例,为你详解“用户画像”的技术特点和使用价值。


个推用户画像产品依托个推多年积累的海量数据及强大的数据分析能力,可为 APP 开发者提供丰富的用户画像数据以及实时的场景识别能力,进而帮助客户了解用户信息,从而助力移动 APP 目标用户精准筛选、个性化推送消息和应用更新下载等。


用户画像的形成需要经历四个过程,主要包括数据收集、数据清洗、数据建模分析、数据产出。其中,数据清洗和数据建模统称数据处理,在经过数据处理之后,个推凭借多年积累的大数据能力,以独特的冷、热、温数据维度分析进行数据产出形成用户画像。

一、用户画像用了哪些技术?

在数据处理阶段,个推用户画像产品的大数据计算架构采用了 Kafka 分布式发布订阅消息系统,这一系统具有高吞吐量、高稳定性的特点。数据清洗可利用 HADOOP、SPARK 实现设备唯一性识别、行为数据的清洗等,从而去除冗余数据。这一过程支持交互计算和多种复杂算法,同时,它还支持数据实时/离线计算。



在数据建模的过程中,主要用了机器学习中的聚类(无监督学习)和深度学习技术,这能让模型对用户行为数据主动学习,进行行为判断,由此产出用户标签。



之后,数据的产出会形成冷数据画像、温数据回溯、热数据场景和定制化标签四种画像。


冷数据画像,是指基于大数据分析出用户的属性,改变概率较小的数据,如用户的年龄段、性别等。


“温数据”则可以回溯用户近期活跃的线上和线下场景,具有一定的时效性。


“热数据”是指用户当下的场景及实时的用户特征,帮助 APP 运营者抓住稍纵即逝的营销机会。


定制化标签是将个推数据与第三方数据结合起来,共同建模得出具有价值的特征标签。总的来说,个推用户画像产品不仅能产出通用的标签维度,也有定制化标签的输出能力。


二、如何构建用户画像?

“用户画像”的构建需要技术和业务人员的共同参与,以避免形式化的用户画像,具体做法可参考个推构建用户画像的流程:


(1)标签体系设计。开发者需要先了解自身的数据,确定需要设计的标签形式。


(2)基础数据收集、多数据源数据融合。在建设用户画像时,个推用户画像产品会整合个推以及该 APP 自身的数据。


(3)实现用户统一标识。多数情况下,APP 的众多用户分布于不同的账号体系中,个推会将其统一标识,帮助 APP 打通账号,实现信息快速共享。


(4)用户画像特征层构建,即将每一个数据进行特征化。


(5)画像标签规则+算法建模,两者缺一不可。在实际的应用中,算法难以解决的问题,利用简单的规则也可以达到很好的效果。


(6)利用算法对所有用户打标签


(7)画像质量监控。在实际的应用中,用户画像会产生一定的波动,为了解决这个问题,个推建设了相应的监控系统,对画像的质量进行监控。


总之,个推用户画像构建的整体流程,可以概况为三个部分:


第一,基础数据处理。基础数据包括用户设备信息、用户的线上 APP 偏好以及线下场景数据等。


第二,画像中间数据处理。处理结果包括线上 APP 偏好特征和线下场景特征等。


第三,画像信息表。表中应有四种信息:设备基础属性;用户基础画像,包括用户的性别、年龄段、相关消费水平等;用户兴趣画像,即用户更有兴趣的方向,比如用户更偏好拼团还是海淘;用户其它画像等。


在个推用户画像构建的过程中,机器学习占据了较为重要的位置。机器学习主要应用在海量设备数据采集、数据清洗、数据存储的过程。

三、用户画像能做什么?

用户画像常用在电商、新闻资讯等 APP,帮助 APP 打造内容精准推荐系统,实现千人千面运营。

基于用户特征的个性化推荐

APP 的运营者通过个推用户画像提供的性别、年龄段、兴趣爱好等标签,分别展示不同的内容给用户,以达到精准化运营。


基于用户特征指导内容推荐

基于用户特征指导内容的推荐是指找到与目标相似的用户群,利用该用户群的行为特征对目标用户进行内容推荐,具体过程如下图:



在这里,我们需要解释一下其中所涉及到的相似性建模技术。相似性建模可类比于聚类建模,它是无监督学习中的一种,它指的是寻找数据中的特征,把具有相同特征的数据聚集在一组,赋予这些聚集在一起的数据相同的特征标签,从而给这些具有这些特性的用户推送相同的内容。



这种推荐方式的优点是,它的自有特征是经过 APP 长期积淀而来,颗粒度更细,适用性更强,对用户的认识更全面,效果能持续提升,而且它还能针对 APP 所处行业与自身需求,量身定制匹配算法,让推荐更精准。


此外,如上文所言,个推用户画像能够结合第三方数据做定制化建模,通过双方共同建模得出显著价值和特征标签,依据不同标签向用户推送不同的内容。这样不仅能保证推送的内容更精准,覆盖面也更广泛,而且标签增补的方式,也可以很大程度上提升流量价值。

四、开发者如何接入?

个推用户画像 SDK 的接入主要有两个方式:


  • SDK 集成:客户端集成个推用户画像 SDK,进行初始化 SDK 后,返回给客户一个 ID 即 GIUID(唯一身份标识), 此 ID 需要由客户端提交到客户服务器,然后服务器通过 API 接口传入 GIUID 进行查询用户画像标签数据。



  • API 接口调用:客户将应用名称、包名及服务端出口 IP 提供后,返回 APP ID 等相关信息。客户根据《个推用户画像数据服务接口文档》及《用户画像编码表》集成测试后方可调用 API 接口查询画像信息。



具体的集成文档参见以下链接:



2019-03-05 11:0510012
用户头像

发布了 83 篇内容, 共 52.2 次阅读, 收获喜欢 187 次。

关注

评论

发布
暂无评论
发现更多内容

将代码分析工具引入Jupyter Notebook的技术实践

qife122

机器学习 代码分析

解码华为云安全“铁三角”:用“分层防御”化解安全挑战

Alter

云计算 AI 云安全

中小型及初创企业如何实现数字化转型?

智达方通

全面预算管理

表格数据深度学习算法NODE技术解析

qife122

机器学习 深度学习

HarmonyOS SDK助力讯飞听见App能力建设

HarmonyOS SDK

HarmonyOS NEXT HarmonyOS SDK应用服务

k8s集群添加master节点报control plane 错误

天翼云开发者社区

容器

AI/ML工作负载的可持续性优化实践

qife122

机器学习 云计算

"芯库"共赢,ArgoDB携手国产处理器完成兼容适配,共筑数智安全根基

星环科技

“大模型”技术专栏 | 和鲸 AI Infra 架构总监朱天琦:大模型微调与蒸馏技术的全景分析与实践指南(下)

ModelWhale

AI 大模型微调 数据蒸馏

三张Excel表引发的效率革命,低代码让老工厂“玩转”数字化

伤感汤姆布利柏

快看!百度提前批的面试难度,你能拿下吗?

王磊

告别微信办公,这款私有化企业聊天软件可能适合你!

BeeWorks

即时通讯 IM 私有化部署

ArgoDB携手国产操作系统完成兼容适配,构建数智新生态

星环科技

3天落地企业级应用,JNPF+AI重塑开发效率

互联网工科生

天猫店铺所有商品API响应数据解析

tbapi

天猫商品详情接口 天猫API 天猫店铺所有商品接口 天猫店铺数据采集 天猫店铺数据分析

五项满分,天翼云息壤智算一体机斩获佳绩!

天翼云开发者社区

人工智能 AI训练一体机

Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理

Apache Flink

大数据 flink 实时计算

除了腾讯会议,私有化有哪些选择?

BeeWorks

即时通讯 IM 私有化部署

直播回放&课件下载| 让AI真正读懂业务:多模态RAG知识平台建设思路

MatrixOrigin

五种 AI Agent:自主功能与现实应用

星环科技

Context Engineering: 基于 OceanBase 的代码文档检索引擎

老纪的技术唠嗑局

AI+ OceanBase 社区版 文档检索

新媒体时代的舆情管理:你监测到情绪拐点了吗?

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

2025最新版天猫图片搜索API全解析:从图像识别到商品匹配实战

tbapi

淘宝API 淘宝图片搜索接口 天猫API 天猫图片搜索接口

咕泡8.8品牌日 | AI革新力,品牌再升级

咕泡科技

人工智能 咕泡科技 咕泡8.8品牌日

全球社交媒体监控在公共外交中的应用与发展趋势

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统

深入聊聊MES、ERP、SCM、WMS、APS、SCADA、PLM、QMS的区别与联系

优秀

CRM ERP mes

MES系统是什么?从核心功能到行业应用,打造智能制造新引擎

万界星空科技

数字化 制造业 mes 万界星空科技mes 智能制造数字化转型

深度参与Apache开源生态建设,天翼云出席COC Asia 2025

天翼云开发者社区

Apache 大数据 天翼云

AI Agent 的 10 种应用场景:物联网、RAG 与灾难响应

星环科技

Labubu 免费送 | 认证、答疑、交流一站搞定!TDengine 开发者新据点上线

TDengine

tdengine 时序数据库

MatrixOne存储优化:HTAP场景下的智能存储优化策略

MatrixOrigin

你真的懂用户画像吗?_移动_覃云_InfoQ精选文章