【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

你做的数据运营,90% 都是无用功

  • 2021-07-07
  • 本文字数:13579 字

    阅读完需:约 45 分钟

你做的数据运营,90%都是无用功

一、零售数据五十年

1、分销阶段:零售启蒙(80s-90s)


先来讲讲零售数据五十年,因为我过往的经历主要在零售的领域,在过去 20 年时间,零售在国内市场发生了很大的变化。在比较早期的时候,在 80 年代到 90 年,外企进入中国渠道快速发展需要借助经销商拓展市场,这一阶段以经销商为运营核心,很多数据的研究与采集都是围绕经销商系统的搭建而沉淀下来经销商数据,其中较有代表性的是 DMS 系统(分销管理系统),是由英语 distribution management system 直译过来,经销商可能会同时装好几个管理系统。

2、门店管理:逐渐深入(90s-10s)

后期随着门店管理深入,发现只管理和看到经销商的管理数据是不够的。除此之外,在 90 年到 2010 年,是零售终端非常强势崛起的时期,前期以线下大型卖场,像沃尔玛、家乐福,还有一些地域性的零售终端为主,后期慢慢向线上的零售终端阿里、京东靠拢,这个阶段被称为门店管理阶段、管理门店数据延伸出后续的用户数据为核心的整套研究体系。我们会去看商品在终端的一个零售价格,一个品类在终端的交易量和交易额。正由于这些需求的存在,此阶段产生了一个大家可能很熟悉的研究公司,尼尔森。它是做零售终端调研数据的,跟零售商做数据交换,数据频率相对比较高,而且数据质量相对非常好,是可以达到每一笔订单的交易,每一个商品的交易。这些恰恰是制造商非常需要的数据。


举个例子,零售终端会把购买频次最高的生鲜品类陈列在卖场最里面,消费者需要一直逛到最里面才能购买,以一个品类带动其他品类的购买,当时门店的陈列管理都是完全围绕着以终端门店为运营核心延伸出来的。

3、用户运营:演变至今(21 世纪 10s-20s)

从 2010 年到现在,随着互联网的逐步深入,大家知道互联网诞生起于电商,所有数据的沉淀基本上都以用户为运营核心。用户登录网站沉淀浏览记录、购买记录……都是以消费者在网上注册的 ID 展开数据链路以及研究,这个阶段称为“以用户为运营核心的用户运营阶段”,在此阶段最常接触的就是 CRM、会员管理/忠诚度管理、用户生命周期,月贡献值有多少、看 LTV 模型预测消费者的购买潜力与行为。


以上就是零售数据最近这 50 年来的业务与数据演化过程,需要提醒大家注意的是,经销商、零售终端和用户始终存在,只不过在不同阶段展开研究的核心不同。这里推荐两本书《商务智能》《零售的本质》,我看过学到了很多。

二、企业数据的不同阶段

为什么要讲这个?我们在整个公司建设过程中,会发现花费很多人力和投入数据团队。但当投入一段时间后,却发现数据对公司业务没有什么帮助。或者说好像是产生了一些帮助,却没有带来一些业务成果,这时候往往是我们忽略了一件事情,在我们企业搭建数据中台,招募数据人才的时候,没有认清企业到底在哪个数据阶段。


为什么这么说?其实在每个行业的数字化程度都是不一样的,我个人认为数字化程度较高的行业有零售、金融、能源、电力这些相对比较传统的行业,数字化程度是比较低的,在中间还有一些整容行业、医疗行业找我做咨询,希望能让企业运营数据化,就是想知道客户有什么需要。


所以,在想做数字化转型或者搭建数据中台,第一件事情是要先判断自己的行业或公司处于数字化的哪个阶段,下面是企业数据的五个不同阶段:



首先,数据化程度高的公司比我们想象中的少,还有很多公司处于无数据的阶段


国内大部分的企业处于有一点数据和有一些数据的第二、第三阶段


这里企业对于数据的概念十分重要,很多企业是以数据验证决策,并没有指望以数据驱动业务,并且更新数据比较慢,以月或者年计。


到了有一些数据的阶段,大家在决策之前就会看看数据,比如先看看市场的门店有多少家,市场的购买能力如何,将数据排序开发市场。当数据与决策不一致则会更多考虑数据,在此阶段,企业有了一定的数据意识,不管是高层还是基层员工都会意识到决策前先看看数据。


由于数据意识的存在,驱动企业内部的数据技术部门进行数据的开发和更新,在这时数据更新是比较快的,最慢也是以日或者周为单位。此时人力部门、财务部门已经有固定的报表展示部门的业绩。


到了有很多数据阶段,决策基本都是依靠数据,如果没有数据,就不会做决策。数据更新也是较快的,以秒级或者小时级更新,如果想做决策,打开数据产品就能看到对决策的建议。在这个阶段各部门都有对应的数据人员支撑,这时候各部门都有对应的数据人员支撑,这也是有很多数据的表现。


最后一个阶段,数据系统很完善,系统里面有大量的数据。但是数据太多分析不过来,数据多元且丰富,不仅有结构化还有半结构化。就拿图片举例,很多快消品公司都会去看店里的陈列,这时候如果找人在门店里填表或者数货架,成本是非常高的,那通过在门店拍照用 AI 识别出来,商品的价格是多少,商品的陈列面是多少,往往需要借助更高级的手段。


以上就是五个阶段,大家可以判断一下自己的公司在哪个阶段,其实国内大部分公司都没有到最后一个阶段,但往往都在说要使用人工智能,这里有几点需要注意:


  • 具备 AI 的基础,需要底层的数据比较干净,都是被标记好的,大量的数据元素都需要有比较好的数据底层,只有在这个时候才有 AI 的基础与应用场景


  • 对于企业来说到底什么具备数据应用的最大场景呢?其实从有一点数据到有一些数据才是国内大部分公司所属的阶段,恰恰最大的机会点也是在这里。很多公司想做非常炫酷,还要用到很好的模型算法,实际上我们的数据远远未到那个阶段,并不能解决公司的问题,回到第一页的这个问题,为什么请了业内最好的数据分析师依然没有帮助到业务?


  • 适合数据分析工程师能发挥的数据底层是否存在?我们的数据是否干净?在采集数据的时候是否基于终极的价值需求设计的?很可能我们想做的事情,根本没有采集到数据。


那么想要数据发挥业务价值,一定要先判断我们的企业属于哪个阶段,根据阶段决定要做的事情和要请的人才。

三、零售业务链路

这是我基于自己过去经验绘制的图。



先看中间虚线框的部分,绿色线代表商品的流向,红色线代表资金的流向,围绕着这些同时还有信息流。商品从工厂生产出来,进入到仓库,再运到分销商,通过分销商分到零售终端,最后卖给消费者,这是非常经典的链路。当然也会有一些特殊的情况,比如直供,工厂生产直接到仓库,不经过分销商卖给消费者。但在零售行业里,生产/工厂、仓库、分销商、零售终端、消费者/购物者这五个元素是长期存在的。


围绕零售主链路,往上是市场相关的部分,往下是运营经常做的最多的业务,延伸出非常多的分析,而这些分析会在各个环节中发挥出它的价值。


城市群划分、渠道动态发展、经销商分级是传统零售和经销商发展中比较常规和经典的分级内容,当我们做了一些新产品的开发以后,怎么去做推广?推广前,我们要把全国城市群根据居民收入水平和对商品的接受程度进行划分,如果按照城镇的等级计划,对产品的推广可能会有误导。可能西北的一个地级城市的居民收入可能比沿海的县级城市都要低,这是由于经济发展不均衡导致的,所以我们会根据商品的特性重新划分城市群,从而决定我们应该在某个城市投资多少的费用和应该做怎样的推广。


接下来看下宏观的东西,人口统计、宏观经济、品类发展、新产品文化与消费趋势、营养与膳食趋势。


有些同学可能会疑惑为什么需要研究宏观的东西?其实很多外资的消费品公司的数据运营业务架构是非常成熟的,假设要在中国市场建厂,要预估在整个市场大概有多少量,要有清晰的了解才能判断要不要投资这么多。而未来 5-10 年的营养与膳食趋势也会影响新产品开发的侧重点。


上面说的是链路的上半部分,下面侧重讲运营经常面对的下半部分。


生产与物流成本、市场与销售成本、管理及其他成本甚至利润,这些都会做一些财务分析,除了财务分析之外还会看媒体花费和线下推广促销费用。我们还会看投了这些钱到底有没有带来一些结果,最直接的结果就是曝光量和收视率的一些指标,品牌知名度是否提升等等,都要去消费者端做用户调研。


除了媒体花费,还有线下推广促销费用,包括渠道建设、渠道促销、终端建议、消费者促销费用等等,花了这些钱也会去看钱到底花的有没有价值。在分销水平这里我要介绍分销率的概念,一个是数值分销率,一个是加权分销率。前者比方说市场 100 家店有 20 家分销我们的产品,那就是 20%的分销率;后者加权分销率,比方说市场上 100 家店有一家卖了 99%的销售额,其他 99 家小店只分 1%,当我们的产品优先覆盖了大店,那加权分销率就是 99%。通过这两个经典指标看商品在终端的卖进情况。


我就不一一给大家介绍每个指标,但要注意在投入以后有没有直接的结果体现,看到这些结果以后,还是要看最终端消费者有没有感知到我们的产品。第一,商品在货架上是否容易被看到;第二,商品是否容易被消费者选择。像包装有问题的商品,会影响消费者的体验,比如看到凹坏的罐不会感到愉悦,就不会想买;还有就是商品是否让消费者感到物有所值。以上讲的就是运营层的内容。


分享了在零售终端和消费者端非常有名的两个指标,第一个是市场份额,在零售终端,同一个品类下 A 卖了 40%,B 卖了 60%,A 想再把市场份额拓展 20%超越 B。对于大部分企业来说,市场份额数据都是通过尼尔森咨询公司买到的,然后把市场份额数据加到销售代表、销售主管的绩效管理中去。一旦有了市场份额数据,就可以和组织自身的增长做对比,判断绩效是否合格,因此市场份额这个指标对于企业的核心发展来说是非常重要的。


第二个指标是渗透率,比较多的出现在后期,随着很多企业的发展,大家就会把市场份额和渗透率混在一起,说成市场渗透率。但是就前期来讲,市场份额一般是零售终端这个环节的指标,而渗透率一般是指消费者的环节的指标。


渗透率指的是什么?就是 100 个消费者,假设有 20 个消费者买你的商品,渗透率就是 20%。在消费者端,除了看渗透率,还要看它的购买频率,包括它的购物量大小。我们经常说的购物篮是说什么?就指的是说消费者在超市买一单有小票,或者是我们在淘宝京东买东西的时候,你的整个订单买了什么?就相当于说我有购物篮,我篮子里放了什么?看它购物量的大小,金额是多少,它的品类是什么?


比如说家庭主妇购物篮很可能就是牛奶和一些日化用品,对于一些比较潮的男性用户,他的购物可能比如说单反相机,游戏这些东西,看每一个单品的价格是多少,从而去看购物篮的毛利,品类结构,像这些都属于购物篮分析,也是购物行为分析的一部分。


在线下零售的阶段,我们回想一下刚才说零售数据 50 年,在线下零售就是零售终端为王的时候,90 年代到 2010 年这个时候,线下零售在购物篮分析上已经非常成熟了,在后期实际上大部分的互联网公司还没有开始去做,当然也会有些人去做,通过深入分析去看。但是方法基本上是会相对比较一致的,它会有一些经典的分析在里面。


因为后面还有内容我就不太展开,实际上大家说这么多方方面面比较复杂,把它归纳出来的话就只有三个核心,就是人、货、场,我在 2015 年做出了这张图,个人觉得是会适用于所有的零售行业的。然后再去做一个大胆的想象,为什么我会觉得零售数据行业,包括整个数据行业都会有很大的潜力?


整个零售的业务链路,如果说可以把所有的环节都系统化和数字化,实际上我们是可以实现自动化运营的。举例子,比如说其实很多线下零售都已经实现了,当库存低于多少的时候,自动给制造商发个订单,制造商的订单系统就自动去运转,然后把货送到指定的位置。像这样的决策的话,可能以前比较靠人,但是后期当我们定出这个数值之后,实际上的话它基本上是可以去自动决策,做到自动发单、运作。


所以当我们去把整个零售的环节完成数字化之后,会极大提高我们整个零售行业的效率。


基于人、货、场三大核心,把所有运营实现系统化之后,会为现在的零售企业降低很多的成本,包括去做一些预测性的分析,也能带来很大的一个增长。

四、增长哪里来?内生维度


内生维度指的是什么?指的是运营哪些事情或哪些指标去提升我们的增长,这也是一个围绕零售的经典的拆解,但实际上因为零售这个范围非常广,要是大胆一点,把房子想成零售,所以的话它其实适用场景非常的广,汽车也算是汽车零售业。


先从销售额拆出我们的下单客数跟客单价,下单客数的话一般会拆成新客、复活、留存。我相信有很多同学应该也是这么拆的,新客的话我们无非是开拓新渠道,以前我们只卖大卖场,我们现在便利店卖等等,叫做开拓新渠道。开拓还有新城、类型,以前卖零售,现在还卖餐饮,就是开拓新类型。


另外一个是深耕老渠道,以前覆盖 10 家大卖场,我们现在覆盖 20 家,这就是深耕。复活这个客户他以前在我们这买,现在不买了,我们得想办法把他拉回来留存。虽然他天天在我们这买,但是他是不是可以买的更多次,或者一周买三次?我们激活他是不是可以买更多次,从而提高他的购买次数。


再看看客单价,客单价由什么构成。我们经常会围绕说你买了几个 SKU。你今天买了两箱牛奶,两三种奶,大家注意 SKU 数其实是有两类的,一个是个数,你先买 2 箱,现在买 4 箱个数变多了,一个是种类,以前就买牛奶,现在还买高钙牛奶,这是种类多了一种,以前你就买牛奶,无论是什么高钙还是什么,但是你现在买乳酪对吧?乳制品又多了一种,种类变多了,这些的话它都会变成 SKU 数量变多,体现在这个指标上。


除此之外的话,还有平均 SKU 单价比较重要的指标,它有两个,一个是商品价格,价格指的是商品今天促销一块钱,价格就是一块,过两天它变成正常价 10 块钱,它买的就是 10 块钱,这是价格的不同。


另外的话还有商品升级,过去一段时间我们经常会津津乐道一件事情,比如 10 年前买一个牛奶是多少钱,现在的话是价格是多少钱?它会有一些商品的升级,主要这个是价格的上涨。

还一种应对消费者需求改变的商品升级,比如说以前我们会买普通的牛奶,后来我们买高钙,脱脂,现在买有机牛奶,反映在平均 SKU 单价的提升上。


我们再往下看,这是一些我们说比较重要的指标,通过抓这些指标,就可以促进销售额。为什么一定要拆解这个框架?当我们去做一些运营的时候,我们一定要非常清晰的知道它到底是对哪一个指标要有提升作用,这样无论在说任何一个细节的事情,我们都是有全局思维考虑的,这个很关键。


除了这些指标的话,有哪些运营动作可以去做到这些?再往下,如何让消费者更多种买设计商品,它会包括商品管理,营销管理,品类管理,定价模型。


说一说品类管理。门店是有限的,它是质上是基于有限的去选择商品效率的一个管理方法,其实现在线上互联网的坑位也是有限的。


这点表现在线下门店是什么?


就是说我们品类它到底要占多大的陈列面,这一种就是陈列面管理跟品类管理相关,另外的话哪些品类它还可以相邻的陈放,哪些品类放在收银口,哪些品类要放在主货架?比如说洗发水跟护肤品是不是要放一起?陈列面有多大,里面有多少种商品?是把这个味道区分开,还是按包装区分开?


在这个分类下应该说 10 只商品还是 20 只商品,20 只商品应该选什么?所有的这些的话都是基于是说我们要去做研究,然后去推进,我们看如何让消费者在有限的空间,包括有限的资源有限的时间下,可以买更多种不同商品,从而的话去提升我们的客单价,提升我们的销售额。


所以这张图的话可以告诉大家什么?第一呢我们要知道我们的增长现在主要是在哪个地方有潜力机会,怎么样通过这些运营的一些方法和一些模块去提升指标。为了提升这些东西可以去做哪些研究,从上到下从下到上把业务去做一个梳理,这个是零售行业的。别的行业也可以去尝试着把你们的增长来源去做一个梳理,这是内生维度这部分。

五、增长哪里来?外生维度

还有外生维度,当我们的增长遇到一些瓶颈,这边举实际的例子,消费品零售业有很多魔力的数字,比如说当一个商品的市场份额到 40 的时候,它很可能就会比较难以突破。


这边到了 40 的时候的话,到 40 之后,我们有时候会给它做重新定位,比如说它在整个休闲食品这个领域对吧?它的市场份额是 40,但如果说我们把它定位成场景化去做一个定位,不仅饿的时候可以去吃饼干,早餐是不是也可以吃饼干?这时候会发现不是只针对中国休闲食品市场,而是从更广阔的领域去看市场份额。所以经常会拍广告,给消费者传递一个概念,饼干其实可以作为早餐去享用的。


这时候实际上你是想去切入早餐市场领域,你的市场份额可能还没有到我们说模拟数字的,所以说可以在新市场做更多的产品开发、市场开拓,就是通过市场的重新定位,获得增长的来源,主要是外生为主。

六、增长哪里来?协同效率


我们经常说增长哪里来,一个是内生维度,一个是外生维度,另外还有一个非常关键的是协同效率,容易被很多的技术、分析运营忽略。意思是我做了一个很好的分析,定了一个非常好的目标,也有一个很好的分析结论,但是感觉没有发挥出应有的价值。


目前来讲的话,大部分企业它都是一个组织,我们做的这个东西它到底有没有被别人所理解?既然我们说数据还可以让业务变得更简单,是什么意思?它本质上是说数据是一个统一的管理语言,当公司里的所有人都在说数据这个统一的管理语言,才可以让对方 100%的理解我们的结论。


大家知道人跟人沟通的时候,其实信息的衰减是非常大的,有可能说完这个事情之后,大家觉得好像挺有用,回去关了电脑,只记住 30%,再睡醒一觉 0%都没有了。对于信息的吸收,是人天生会有一些衰减的,但是数据就不一样。我们经常说英语可以比较好的沟通,它逻辑性比较强,其实数据的话是全球的一个非常好的通用语言,在我们解释生意情况时候,我们说增长率上升了,这些在全球整个企业管理领域基本上全都是一样的。当我们在说一样的一个管理语言的时候,是可以让对方很好的理解我们。


协同效率会带来什么样的价值?举个例子,当我们说一个目标,我们是不是所有人都理解这个目标应该如何去做到?是不是所有人都知道是目标,其次的话,是不是所有人理解怎么去做到?拿多少的费用,拿多少的资源,然后得到多少的目标,需要多少的增长率,我需要多少人,那一个人对应多少客户对吧?这些的话都可以去把它量化来表达出来。当我们去把他电话表达出来的话,他就可以从我们组织里的级别一层一层传递下去,直到组织的最细的末梢的人。


大家知道基本上一些我们说小型公司也可能有一两个层级对吧?但是大部分的组织,因为随着我们的信息的越来越多,很多大型的组织他为了去做一些事情,基本上可能我们说十几个层级不等,从最高管理层到我们的销售代表,或者说到最新末梢的员工,十几个层级,我们在做业务的时候,如何保证十几个层级都是一致的,我们看左边这张图,实际上是需要拿数据去提升我们的协同效率。


右边这张图是指当我们有了这些数据的一些分析,我们其实完全上是可以把它去沉淀到我们的数据系统里的,变成我们的数据产品。数据产品可以帮助我们去让更多员工去使用,使用完之后他会有一些数据分析工具的理解,也会去做一些创造,又去影响其他人,这样子我们会发现通过数据的一些协同,让整个组织变得更聪明。


注意到了现在的时代,个人他对于整个行业的贡献价值实际上相对来讲是会比较微弱的,在做很多事情的时候,都需要是让整个组织变得聪明,才能赢下市场。只有整个组织通过数据变成智慧型组织,协同效率才会非常的高,从而带来更加极致的增长。这边是以前大家会经常忽略的协同效率。


因此做数据化运营,想为公司带来价值,我们就要在各种各样的场景去用数据去表达观点,包括用数据去解读业务,培养整个公司的数据意识,增强协同效率,它会在更长远的一个时间段去帮助我们的企业带来更好的增长。

七、增长哪里来?——结果与过程的转化


简单讲一下结果与过程的转化,我们在做销售额的时候,我们会有一些结果指标,除了这一类的指标之外,还有过程指标,一定要把过程监测的指标跟结果指标做连接之后,才可以说监测了这些过程指标,从而带来结果的指标。经常会有很多企业过程指标跟结果指标相背离或者相脱离,虽然过程指标跟结果指标完全没关系,天天追过程指标会带来什么结果?


在定完结果指标之后,一定要把它推到过程指标里。在做完拆解之后,要验证过程指标到底有没有带来结果指标,也就是业绩。然后去实施评估,因为市场环境就一直在不断的变化,结果指标跟过程指标不是说不变的。

八、数据需求矩阵


这块具体重点讲最右侧的对内赋能,我们对分析师工具的话有哪些行业的工具?因为我个人用过很多数据分析工具。我们的需求方经常跟我说,帮我写段 SQL 吧?今天要提 a 产品,明天要提 b 产品,这种其实很浪费时间,还得重新写一遍。难道 copy 的一遍不就行了吗?这个也是需要花时间的。


如果可以去找我们的数据产品和数据技术开发一个产品,针对像这种比较固化的且日常需要的,只要去给他更换时间,更换商品名称就可以让需求方自己去查,它其实是把一些比较固化的简单的产品节省了分析师的时间。像这种轻量级的 SQL 产品,我觉得在大部分的企业中都是非常需要的,因为很多人他的一些数据需求实际上都是非常简单的,但是却花费了一些分析师的时间,这个其实是非常不经济的。


另外的话就是可视化产品,可视化产品为什么会相对比较重要的?


因为大家知道对于人来讲,人的信息读取的设备,我们把自己假设成一台机器,其实它读取设备最大的传播速率的是我们的眼睛,眼睛比起耳朵、手,在同样时间内要读取更多信息的。

所以当我们把一些信息变成图之后,会更快了解更加复杂、更丰富的信息。


这里当然指的是合适的图,我们会经常看到有一些图表不是很合适。比如说看增长率,你非给它画个饼图就挺奇怪,会给读图造成更大的障碍。在你选择合适的图之后,可以通过一页 PPT 表达很复杂的信息,很生动化的信息,所以可视化的产品也非常有用。


另外的话就是方法论沉淀,指的是什么?当我们做了一套比较好的分析方法论,比如说如何选择爆品分析方法论,我们有了最好把它牵到数据产品上,不要每次是说分析我都把它做一遍,实际上这样的话其实没有意义,一方面的话是浪费分析师资源,另外一方面像这样的方法沉淀到数据产品上,才可以在公司更大的范围发挥作用。


所以一个分析方法已经被验证是成功的,第一步要干什么?就是一定要把它迁到数据产品上,这样整个公司它会变得聪明,才能沉淀越来越多的方法下来。


下面两个比较常规了,把数据产品达到指标颗粒度通过拖拽指标,就可以实现整个公司大部分的简单的分析,把它称为探索平台,像这样的工具也非常好用的;另外一个就是查一些字段,包括一些常用的语句的数据地图。

九、两个实用的场景化方案


  • 第一个,面对业务问题,我们怎么去建立思维框架?


这里核心我就给大家提几个关键词,前面分享了一个零售业链路图,因为我们可能不仅是零售行业的,还有各个行业,最好去梳理自己的业务链路,然后在业务链路这个框架下梳理出指标,运输指标,并且确定这些指标的先后关系。



你可能第一次做觉得说这个图处理的不好,但是我建议你多做几次,包括刚才零售链路其实让我梳理了好几年,我现在还在不断的改它,每当遇到新东西,都会把它放到我的思维框架里,让整个梳理变得更清晰,所以一定要做刻意练习。


另外的话就是从全局到细节,我们先梳理出来主链路,然后在它的上游,下游的指标是什么?这样去理解问题是为了可以拓展思维的纵深度,从过去到未来,未来会发展成什么样,就可能需要一些时间的沉淀。


几个关键动作:想、讲、写、做


我们要不断的把物理世界的一些事情不断的抽象、提炼出来,咱们今天前面讲了一些数据运营如何发挥价值,到后面开始讲心法了,方法论是吧?这个是我个人的一些经验。


如何把我们整个行业的链路梳理出来,核心是第一要刻意练习,比如说今天你看这个行业的一个信息,你就去把它梳理出来,明天换一个行业把它梳理出来。


核心是去刻意练习梳理,然后去交给别人听去把它写下来,这样子的话才能不断的让我们的干货变得更干,也是对自己不断的刻意挑战。



举个刻意练习的例子,替一个高尔夫球场做数据梳理,首先我们会把它分成前端、中端和后端有高尔夫球,你来打打之前你在体验的时候什么样的情况?你打完高尔夫球之后的话,你的口碑情况是怎么样?会去做一些梳理,然后再往下的话,会有哪些研究方法?这些研究方法需要收获什么数据,收集什么数据,数据这些数据的话,它会有哪些商业意义,我们都把它先梳理出来。


一定要先梳理业务框架,再去做数据采集跟数据分析,这个是非常关键的,也是我们说数据能不能发挥价值的一个 7 寸点,一定要先把业务流程梳理出来,要不然我们的分析就会比较局部,或者是说对于业务理解不够深刻,所以这是第一步。


  • 第二个问题,如何拆解业务需求的黑匣子?



这里讲几个我觉得比较关键,以及分析师可能最常犯的错误。


第一,收到了一个分析之后立刻去干,比如遇到一个错误,也不去问背景信息也不去问这个是怎么来的需求,举个例子老板说你帮我看一看我们最近销售额为什么下降了,然后你跑去花了很长时间去分析,然后后来最后你大概一两天,然后你会回来又问了老板说要把我们销售额没下降,对吧?你可能后来才发现老板最开始提的就是有问题的。


老板说我是让你看某某城市的下降了,然后为什么两天前没有去跟老板确认这个背景信息,因为分析师的工作都比较忙,大家一定要把每个需求的背景信息确定清晰,确认清楚之后一定要形成备忘文档。跟他说,我理解是不是跟你理解一致,这个是很关键的,因为数据“失之毫厘谬以千里”,所以大家一定要注意这些细节的确认,包括背景信息的确认。


另外一个就是不要刻意避免冲突,很多分析师他在去了解背景信息的时候,分析师本身就是客观的角色,不用担心去对背景对方会不会不高兴、认为不专业等等,不要有这些心理负担。

十、后话

针对数据运营如何驱动业务增长,dbaplus 社群邀请做了分享,反馈不错,这是一个好的迹象。在过去很长一段时间,各方对数据运营的概念都较为模糊,对于数据运营发挥的价值也较为存疑。背后的主要原因是,对于数据运营该如何去做,没有合适的方法论。《数据运营之路》针对这一实际情况,给出了更加适用国内数据现状的解决方案。本次的分享也围绕着几个热点问题展开:


  • 企业搭建数据中台后如何让数据价值得以真正发挥?

  • 数据运营人员如何通过正确的运营方法少走弯路?

  • 结合实践分析如何通过数据做用户增长和商品管理?


真正可以让数据价值得以发挥的方法是什么?


首先,信息技术只能解决一部分问题。目前在大数据技术、数据挖掘方面,市面上均有不少著作,让数据市场增益不少。但是在应用层面,市场上绝大多数企业并不具备互联网企业的技术实力和数据积累,这些高阶的技术至少在现阶段无法使用:一方面受困于成本原因和,另一方面数据严重不足的局面使,这些高阶的技术至少在现阶段仍无法使用这些技术无法使用。在业务尚未清晰的情况下,盲目地迷信数据可以解决业务问题,也不切实际。


解决实际的商业问题只能依靠具备行业经验的专家,而这部分能力需要长时间的沉淀,以及对于行业的深度了解。对于数据背后的商业逻辑理解,对于数据背后的商业规则明晰,对于数据之间的勾稽钩稽关系,都需要基于业务的先后和进入的快慢,结合企业的目标,进行指标树的建立,让数据在指标树里流动起来,让企业内部的数据像血液一样流动,激发企业心脏活力,让整个企业运营“活起来”。


企业从挖掘到发挥数据价值,可分为七步以下步骤:链路梳理、指标建立、数据采集、数据流动、数据分析、数据运营、价值输出。


对于大部分非数据行业从业者来说,将数据行业被等同于数据分析行业,。这是极大的误解,也让大部分人认为,数据的价值需要靠“分析”这一动作来实现,从而迷信大量分析技术、和模型,希望可以通过分析技术产生数据价值。市场上衍生出来大量分析工具、分析软件,软件即服务(SaaS)应需求而生,但数据价值却在实际应用中形象模糊,好像有,又好像没有。分析其背后的原因,其实这是就是由于产生数据价值错误的路径造成的。


分析数据,首先需要了解:数据本身是否已经足够被分析?质量是否足够好(全面,、准确)?数据本身是否具备被分析的条件?对照组设置得是否合理?数据分析获得了好的效果,并不一定是分析技术有多好。其实,在实际工作中,大部分问题在数据采集阶段就已经被解决了。


数据这一概念涵盖的内容众多,为了有清晰的方向,必须对数据行业有更清晰的理解,数据分为五层:采集/获取、存储、展示、联结、智能。数据智能绝不仅仅是该层所代表的技术算法,而是各层彼此的递进整合;只有从第一层开始逐级做好,才能实现最终的数据智能。


以现实场景举例说明,某数据公司为某饼干商提供了基于包装、口味的趋势分析后,饼干商要求了解产地的趋势分析,数据公司无法提供的原因是“数据库里并没有对饼干的产地进行区分的数据”。在这种情况下,虽然数据公司有商品数据库,也有技术精良的分析人员,但无法进行准确的分析,。除非回到数据采集层,重新采集商品所需的该字段数据,但这将产生非常大的巨额成本。


数据的兴起源于互联网的兴起,围绕互联网工具产生了大量数据。在初期,这些数据绝大部分是被动产生的。比如,使用作业流程管理软件主要为了管理作业流程,但是各个环节有了数据节点,围绕这些数据节点就被动产生了很多数据。这些数据产生后,被具备数据分析能力的人员收集,用来分析作业效率。


随着数据行业的逐渐发展,部分数据从业人员发现,被动产生的数据可以用来解决商业效率问题,但不足以解决所有的商业问题。解决所有商业问题所需要的数据,往往不在流程工具可以覆盖的范围内。这个时候,就需要主动获取数据。依托自身强大的技术能力,互联网企业被动产生数据的成本几乎为零,主动采集数据的成本也非常低。


大部分互联网企业都会对外宣称和强调自己的数据计算能力,以及运用数据获得价值的能力,甚至直接把自己定位为数据公司,将数据作为企业的主营业务,并通过其数据能力对外部市场进行赋能。目前,加入这一阵营的互联网企业越来越多。这也是互联网企业数据成本低而传统企业数据成本高的主要原因。


互联网企业的业务均在工具里被展开,被动产生的数据在采集/获取阶段并没有成本,主要成本在存储、解析、计算和分析上,而传统企业的数据多为主动采集的数据,成本较高。同时,由于不具备存储、解析、计算的能力,转而向外寻求技术外包,甚至一部分分析工作也“在外进行”,从而可以节省精力将其投入主营业务,体现了社会分工的效率性。由于产生数据的方式不同,数据本身的质量和应用范围也十分不同。


互联网企业的数据伴随工具产生,在需要主动获取数据的时候,也会修改工具(在不影响工具功能与体验的前提下)以获取该部分数据。不过,仍旧是用户在使用线上工具时被动产生的这部分数据规模大、交互多。正由于随着这部分规模大、交互多的数据被大家更多地了解和讨论,国际数据公司(International Data Corporation,IDC)推出提出了大数据的标准化定义和大数据区别于非大数据的四个属性,分别是即数据规模(Volume)、快速的数据流转(Velocity)、多样的数据类型(Variety)及巨大的数据价值(Value),并由此定义了什么是给出了大数据的标准化定义,并拉开了大数据和小数据谁更有用之争的序幕。


在发展后期,我们逐渐发现,这样的讨论并无实际意义,数据的目标是解决实际问题,根据业务、需求场景的不同,可能单独应用大数据或、小数据,或者以整合形式来解决问题。数据不分大小、量级、交互等,这些特征本就是数据自身的属性,只是技术的发展引起了某个属性值的不断突破。


在此基础上,需要提出数据价值论。规模大小、流通速度、多样性是数据的内在属性,而数据则是通过业务逻辑、挖掘数据,最终创造出价值。这一属性不属于内在属性。数据是数据价值的原材料。数据的存在是为了创造价值。没有价值或者无法获得价值的数据,无论其规模、流通速度、多样性多么突出,对于企业来讲,都是成本的浪费,更严重的,是甚至可能存在的对决策的误导。


所以,对于数据来讲,选择合适的方法和人才,以客观严谨的态度获取数据价值,才是最关键的部分。这一部分就是数据应用环节,而这一环节在数据发展至今一直被忽视,导致大量数据成本产生,却无法创造相应的价值。数据从业人员经常说的一句话是:数据是金矿。其实数据是矿石,让矿石变金矿,需要“点石成金”的技能;找到矿山,还需要认知和远见。


归纳三个核心关键点:

  • 首先要判断自己企业所在的数据阶段,根据所在阶段寻找适合的人以及搭建产品。

  • 开展数据运营工作前,先做业务数据架构,把业务和数据有机结合起来。

  • 做好数据采集,确保数据质量的基础工作。


Q&A


Q1:老师,零售行业的数据应用现在都有什么经典场景?

A1:零售行业的数据应用丰富多样,以下是我梳理的零售业务链路图,每一个模块下都有对应的应用场景和方法论。


Q2:老师您对数据运营人员的职业发展有什么建议吗?

A2:数据运营人员在未来 5-10 年会处于供给远远小于需求的阶段,会产生很多市场机会,是一个值得深耕的好行业。除此之外,我建议每一个数据人员都需要问问自己,是否真的对数据运营工作感兴趣。因为这个领域的工作,不仅工作强度大,而且技术日新月异,业务丰富多样,如果不是心中有热爱,很难持续的成长和突破,这份热爱很关键。


Q3:请问老师,数据分析常用工具有哪些?

A3:一般分析师会用到的语言和工具会有:sql, python, R, minitab, spss, tableau, thinkcell。



Q4:企业遇到大量数据,人力有限的情况下,怎么根据业务需求选择运营的重点?能否举例说说?

A4:一方面最节省资源的关键是一定要先了解数据质量是否可用,避免工作的反复;其次,资源有限,不过需要快速输出结果的情况下,最好借助从业 15-20 年以上的行业分析师,加上业务的判断协助聚焦问题所在,用验证性分析减少资源投入。当然,如果资源允许的话,做全面的分析肯定最严谨,但在现实的场景中,用专家+业务+分析的方案可以最快解决问题。


嘉宾介绍:

张明明,《数据运营之路:掘金数据化时代》作者,美菜网 策略规划中心 负责人。


  • 15 年跨国消费品公司,创业公司及市场研究公司从业经历,积累了丰富的商业数据研究、系统搭建与企业信息整合相关的实践经验,对企业整合分析、市场与消费者研究、数据应用市场等有深入的理解;

  • 《数据运营之路:掘金数据化时代》作者,在读博士。


本文转载自:dbaplus 社群(ID:dbaplus)

原文链接:你做的数据运营,90%都是无用功

2021-07-07 07:002186

评论

发布
暂无评论
发现更多内容

Java 动态代理原理

菜皮日记

Java 动态代理

PHP7内核实现原理-基本环境和C基础

菜皮日记

php

蓝易云:为什么DNS使用UDP而不是TCP详解!

百度搜索:蓝易云

Linux TCP 运维 udp DNS

四种常用限流算法对比

菜皮日记

限流

使用基于 tideways 的 php-monitor 搭建 PHP 性能监控平台

菜皮日记

php

MongoDB 官方文档笔记之分片 Sharding

菜皮日记

mongodb

Java 中反射、注解、动态代理、AOP 之间的联系

菜皮日记

Java aop

PHP7内核实现原理-基本架构

菜皮日记

php

PHP7内核实现原理-启动过程

菜皮日记

php

PHP 使用 nikic/php-parser 处理 AST

菜皮日记

php

PHP7内核实现原理-变量的基本结构

菜皮日记

php

行为型设计模式-访问器 Visitor

菜皮日记

设计模式

好奇是开启智慧的钥匙 - 读《朝闻道》

菜皮日记

读书笔记

AI 帮我写代码——Amazon CodeWhisperer 初体验

亚马逊云科技 (Amazon Web Services)

Java 人工智能

2020 年书单

菜皮日记

读书笔记

MongoDB 官方文档笔记之索引 Indexes

菜皮日记

mongodb

MongoDB 官方文档笔记之存储 Storage

菜皮日记

mongodb

PHP7内核实现原理-内存管理

菜皮日记

php

行为型设计模式-策略 Strategy

菜皮日记

设计模式

行为型设计模式-模板方法 Template Method

菜皮日记

设计模式

前辈从业多年的心得分享 - 读《这就是软件工程师》

菜皮日记

读书笔记

PHP7内核实现原理-词法和语法分析

菜皮日记

php

蓝易云:Linux系统有哪些常用的网络命令,分别适用于什么场景?

百度搜索:蓝易云

云计算 Linux 运维 云服务器 ECS

京沪永远涨是否会涨到永远 - 读《菜场经济学》

菜皮日记

读书笔记

tornado 的协程调度原理

菜皮日记

tornado

MongoDB 官方文档笔记之复制 Replication

菜皮日记

mongodb

PHP7内核实现原理-数组的实现

菜皮日记

php

图像智能AI降噪软件 Topaz Photo AI 激活最新版

胖墩儿不胖y

Mac软件 图像降噪 降噪工具 降噪软件 降噪软件ai

行为型设计模式-状态 State

菜皮日记

设计模式

PHP Composer 的自动加载

菜皮日记

php composer

你做的数据运营,90%都是无用功_大数据_dbaplus社群_InfoQ精选文章