低代码到底是不是行业毒瘤?一线大厂怎么做的?戳此了解>>> 了解详情
写点什么

阿里巴巴 M-DMP 负责人许成访谈:从顾客管理到消费者管理的升级

2013 年 7 月 26 日

7 月 13 日,第三届阿里技术嘉年华在杭州召开,大会为期两天,涵盖“前端技术”、“业务架构& 后端技术”、“搜索”、“大数据应用”、“无线技术”以及“测试”等专场,有将近3000 人参与。在14 号的“广告”分论坛上,来自阿里巴巴的高级产品专家许成以“淘宝DMP 平台”为主题分享了阿里巴巴DMP 平台(Data management Platform,基于对消费者数据的管理进行更高效营销和广告投放的整合平台)的概况,InfoQ 在现场对他进行了采访。

InfoQ:许成老师首先请您介绍一下自己?

许成:我是许成,2010 年来到阿里巴巴,负责阿里巴巴的直通车定向推广业务,2011 年的时候,我们做了第一个淘宝 DSP,据我了解,应该是中国第一家真正意义上的 DSP,2012 年开始做 DMP 平台,在来阿里之前,我在硅谷做了两家创业性的小公司,一家是广告相关,另一家是与数据相关。

InfoQ:这次您在主导的产品是 M-DMP,能不能给我们介绍一下它的产生背景和现状?

许成:DMP 这种产品在国外是很多的,在中国也不少,他们有不同的关注点:有些是关注数据交易、有些关注后台数据的管理,我们的关注点是营销,因为我们认为数据,尤其是大数据是要在应用场景中才有价值的东西,我们关注在广告渠道里面的营销,就把它叫做 M-DMP,它是 DMP 的一个变种,能够通过数据的整合管理,让整个营销的效率更高。同时为了达到这个目的还需要更丰富的数据,因此需要数据的交易、整合、和无线数据打交道等,这些环节都相当于 M-DMP 的一个功能或者是我们的一种方式,但目标都是能够让消费者管理做起来,使得商家能够从顾客管理升级到消费者管理。

InfoQ:您提到数据 M-DMP 的核心,现在阿里有一整套完善的数据体系,但是你们还会引入第三方的一些数据,比如说高德地图或者新浪微博,那么你们会提供怎样的一种机制让他们更方便的融入进来?

许成:最主要的就是两个方面:

  1. 数据的关联;这是一个偏技术性的机制,因为不同的数据体系有自己的 key,不同的 Key 怎么样才能够关联、打通起来其实有很多的技术细节。现在我们工作中特别重要的是移动数据和非移动数据、线上数据和线下数据的关联、打通,这个是一个持续进行的过程。从我分享中举得那个例子也可以看到,移动和非移动数据的关联,有的时候成功率能达到 30%,这是一个起点,最终是希望越高越好;
  2. 数据的授权和交易的机制;因为数据要流动起来,不可能说你就把数据通过光盘这种方式给我就行了,这种方式之前有人用过,但是后果很严重,为什么?因为数据流失了,而且数据的产权保护也成了一个大问题,所以这种方式是不能够持续下去的!我们的机制是把数据的授权和交易做到一个平台之内,相当于一个市场的概念。这样每一个数据提供方,比如新浪微博,他们可能就有动力去把他的数据变得更好,而且也愿意拿出来分享。

目前这两个点我们现在都在进行当中。

InfoQ:也就是把数据做成一个闭环,在可控的范围内。那么通过 DMP,我们希望能够进行精准的营销,开始的用户是一个很大的范围,现在能够压缩到很小,然后对这部分人群进行精准投放,比如说有些品牌他们做品牌知名度的推广,越多人知道越好,这时希望另一种方案,怎么办?

许成:把 DMP 等同为精准投放其实不完全对!我们的目标更多的是对人群有一个全方位的了解,这个人群可能是一个很大的人群,所以我也一直在强调,我们的产品定位是消费者管理。只要你对消费者有一个比较好的了解,那么有可能发现能够找到很大的人群量。比如我刚才举得戴尔电脑的例子,比如曾经购买过戴尔品牌的回头客量很少,但是我们对消费者了解的非常精准,我们知道 18 到 25 岁的学生是我们的潜在消费者,那么就可以通过满足各个维度需求的数据透视分析,实现大规模用户的精准、定向投放。也能满足对于追求比较高效果的高精准投放需求。

这些其实都不需要 DMP 帮他们来做,完全是客户自己来判断,我们只是设计了一个平台,品牌也好、淘宝店也好,都可以去定义他们期望的消费者人群。

InfoQ:相应的也能够做关联?

许成:是的,比如客户有自己的 CRM 系统,当时他们对客户的了解是片面的,而这个客户在全网的消费情况是怎样的?他们没有办法做到,比如有人在联合利华买了一块肥皂,他们只是知道他是联合利华的客户,但是作为一个消费者,他有更加丰富的信息,这些信息对于联合利华来说远远超过了他在店里买了一块肥皂的价值,这个时候客户就可以通过系统做关联对他进行更精准的推送,价值就凸显了!

InfoQ:比如说现在新浪微博的广告现在有一个问题,如果我是用户,在购买了一口锅之后我的新浪微博就全是锅了,但是这个锅我已经买过了,所以从需求上讲我现在就不需要这些信息了,就感觉广告是没有上下文的?

许成:这不是数据平台的问题,是 DSP 投放策略的问题,就如第二场品友互动所讲的,对他们来讲数据是他的上游,那么广告投放、消费者就是他的下游。从某种意义上讲,比如我们在新浪微博上面非常了解这个消费者,知道消费者最近买了一口锅,但是针对这个消费者特定的标签该怎么去管理、怎么去定义?这还是没有做得特别好的一件事情。可能买了锅,只能说明他是一个对日用品或者厨房用品有兴趣的消费者,那么更好的一个方法是卖厨房用品的品牌,针对这个消费者去做投放。我觉得 DMP 接入之后,这个情况会有所改变。

InfoQ:刚才您提到 DMP 赋予了广告主很多的能力,实现对人群更精准的细分,但是 DMP 后台目前看起来有些复杂,有时候广告主也不知道这些设置对他们的选型有怎样的影响,所以他们必须有一个试错的过程?

许成:这其实是技术挑战,主要有这几个方面:

  1. 用户界面;如何把这么多维度以一种直观的方式展示出来其实是很复杂的,并且还要有很好的互动,这是一个技术挑战!
  2. 建模的挑战;比如说广告主经常是说我要把这么多的钱花掉,而且我希望广告效果还可以,这个时候就是一个质和一个量的博弈,需要有较强的算法建模能力,目前我们的平台里还没有,后期可能会采用开发平台的方式,让算法人员能够接入进来;
  3. 实时性;因为客户需要在线去试,这才是真金白银的东西,客户试出来的结果也是特别有价值的,这时就需要有一个非常快的机制能够给出结果。比如说我的前台,设定了一个人群,然后能够在很快能得到反馈,就可以去做优化的动作。

那么这三个方面其实都有很多的技术挑战,现在 M-DMP 平台还刚开始,很多技术能力我们现在都没有,包括阿里在内现在都做不到,我不知道国际上能不能完全做到,对于这些维度很大、实时性很高、建模要求很高的技术其实难度很大的。我理解这种业务需求是在推动技术向边缘在发展,如果真的是这样,就会把诸如大数据技术等推上一个新的台阶。

InfoQ:你们也用到了比如说阿里数据平台等其他技术部门的支持?

许成:我们跟他们有非常紧密的合作,也经常在推动他们,希望他们去能够在实时性、高纬数据透视等技术方面提供更强大的支持。

InfoQ:刚才演讲中您提到会把第三方接入进来,让他们提供一些定制的服务,这个能介绍一下吗?

许成:我们在最开始设计这个产品就考虑到这个问题,希望能够把数据开放出来,让开发者能够通过提交算法来把数据转变成标签,然后开放给广告主。由于底层的数据是各种具体的行为,不会提供给广告主的,那么在我们和广告主之间就有一个空缺,需要开发者来填补。

InfoQ:比如说我要把第三方接入进来,肯定会谈到用户隐私问题,因为这个 DMP 他这个平台就是在对用户的很精准的一个跟踪,这块用户隐私,刚才你也谈到他不会破坏用户隐私的现状。

许成:对于用户隐私,我们的理解是这样:

  1. 诸如用户身份证号、电话号码等隐私性最强的信息,如果被泄露出去,甚至会有法律的一些后果,所以我们绝对不会把这部分数据暴露出去;
  2. 对于一些比较弱的信息,例如用户兴趣、购买行为等,用户可以自己设置是否希望公开给广告商作为精准投放的分析数据源,当然,用户既希望能够获得精准的推送,又不希望隐私泄露,其实也是一个博弈的过程,我们只能不停的去尝试,让大家获得一个相对满意的结果。

InfoQ:刚您说到在接入第三方过程中有一点,就是关于移动这块的接入,这块能不能具体提一下?

许成:我们认为移动是很关键的未来,因为从消费者的路径上来讲,移动变得越来越重要,而且移动有个特点,它更像是消费者的第三只手。消费者会随身携带这个设备,PC 做不到这一点!那样,移动设备能搜集消费者的信息,也能够让消费者受到自身的影响,但目前移动数据的搜集和打通还是一个国际性的挑战,在我的分享中也提到了一些方法。

InfoQ:比如说嵌入 SDK 这样的?

许成:现在是这样的,但是我知道美国有一家公司,他们好像想出了另外一种方法,大致是通过统计建模的方法来预测。比如说用户拥有手机、iPad,但是平台不知道这些设备属于同一个人,他们能够利用搜集到的 IP 地址信息、应用信息等通过概率的手段判断相关性,这个过程不涉及隐私的问题,只要概率上能够判断大致的人群就能够做广告,这是一个好的方法,我相信也有其他的方法。

InfoQ:从刚才您谈到 DMP 现状,我觉得它的一个构想是很好的,也希望能够推动现在广告的发展,那么对于它今后一个发展路线,是怎么来设想的?

许成:数据有点像我们手中的钱,本身是没有任何价值的,数据底层就是 01 字符串,但是它一旦进入流通就出现了价值,这个流通过程包括广告、金融领域等,数据能够帮助这些业务发展。广告是 DMP 的一个核心应用,我个人认为这只是第一步,也因为他比较直接,能够立刻见效。但数据驱动业务,对于健康、医疗,保险等都是非常关键的。所以,我们要在底层技术上要不停的往前走,上层的应用方面找更多的出口,这两个方面结合我觉得才有可能做出更好的类似与 DMP 的应用出来。

InfoQ:所以您的那个角度还是从数据为出发的原点,然后让它推动其他的产品,现在比如说广告只是推它的第一个?

许成:只是其中一个而已,所以说大数据这个词本身有点虚,只是把数据都放在一起就好了吗?不是这样的!数据放在一起是就是一些结构化的数据信息,其实没有什么太大意义,但是如果把它放在一个业务里面,比如说帮助广告主能够提升他的 ROI、做更好的品牌推广或者说帮助银行去做更好的贷款投放,亦或是帮助病人更好和其他相关的人来沟通等等,我认为这些目标才是真正的驱动力。

2013 年 7 月 26 日 05:123349
用户头像

发布了 89 篇内容, 共 26.5 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

一枚程序猿的MacBook M1详细体验报告

Zhendong

CPU飙高问题排查

程序猿玄微子

三万字无坑搭建基于Docker+K8S+GitLab/SVN+Jenkins+Harbor持续集成交付环境!!

冰河

Docker 云原生 k8s

二分发代码模板

小兵

数字货币——货币的第四次革命

CECBC区块链专委会

数字货币

免费下载O’Reilly出版社全新之作《建立机器学习流水线》

计算机与AI

学习

使用 Go 实现 Async/Await 模式

Roc

go golang channel goroutines Async

利用 Arthas 解决启动 StandbyNameNode 加载 EditLog 慢的问题

阿里巴巴云原生

阿里云 开源 云原生 中间件 Java 25 周年

《华为数据之道》读书笔记:第 6 章 面向“自助消费”的数据服务建设

方志

数据中台 数据仓库 数字化转型 数据治理

聊聊销售背后的策略

吴晨曦

创业 销售管理

面试无忧:源码+实践,讲到MySQL调优的底层算法实现

小Q

Java 数据库 学习 面试 算法

Scala语法特性(三):面向对象的独特点

正向成长

特质 样例类 case class Traits

第六周作业

Griffenliu

我是如何使计算提速>150倍的

Lart

Python 代码优化 Numpy

Nginx的反向代理与负载均衡--配置Nginx

Linux服务器开发

nginx 负载均衡 反向代理 后端开发 Linux服务器

甲方日常 59

句子

工作 随笔杂谈 日常

Spock单元测试框架实战指南四 - 异常测试

Java老k

单元测试 spock

区块链如何助力精准扶贫?

CECBC区块链专委会

区块链 扶贫

《华为数据之道》读书笔记:第 7章 打造“数字孪生”的数据全量感知能力

方志

数据中台 数字化转型

阿里架构师花近三个月时间整理出来的Java独家面试题(Java岗)

Crud的程序员

Java 编程 架构 java面试

顶层设计已基本完备 数字货币将进入加速推进阶段

CECBC区块链专委会

数字货币

区块链开发落地,联盟链系统平台搭建

t13823115967

区块链 区块链开发落地 联盟链系统平台搭建

【薪火计划】06 - 你推崇的领导方式是怎么样的?

brave heart

管理

架构师训练营第十一周总结

邓昀垚

JVM调优不知道怎么回答,阿里总结四大模块,学不会就背过来

小Q

Java 学习 架构 面试 JVM

架构师训练营第 1 期 - 第 10 周 - 学习总结

wgl

极客大学架构师训练营

磁盘到底是怎样工作的?一文理解硬盘结构

Guanngxu

操作系统

区块链政务系统开发解决方案

t13823115967

区块链+ 区块链开发落地 政务系统开发解决方案

Arthas 实践——生产环境排查 CPU 飚高问题

阿里巴巴云原生

开源 云原生 中间件 Java 25 周年 Arthas

第六周学习总结

Griffenliu

架构师训练营第二周框架设计学习总结

Geek_xq

2021 ThoughtWorks 技术雷达峰会

2021 ThoughtWorks 技术雷达峰会

阿里巴巴M-DMP负责人许成访谈:从顾客管理到消费者管理的升级-InfoQ