把握行业变革关键节点,12 月 19 日 - 20 日,AICon北京站即将重磅启幕! 了解详情
写点什么

指数之美

  • 2021-04-07
  • 本文字数:2247 字

    阅读完需:约 7 分钟

指数之美

什么是指数?

用经济学的概念来理解,任何两个数值对比形成的相对数都可以称之为指数,比如用天气的湿度比上温度得出来一个数值,我们取个名字叫温湿比,对这个数值进行监控就得到了一个指数的趋势变化。当然,实际上的指数不仅仅包含这两个指标,可能会有很多,比如营商指数,就包含近 1400 个指标。


指数在不同领域都有应用,上面说的温湿比是天气指数中的重要因子,在零售行业上应用比较广泛。举个例子,温度和湿度会影响蚊虫幼卵的孵化,在一定程度上会直接影响小区周边便利店内花露水的销量,因此很多咨询公司都会参考天气指数为零售公司提供解决方案。


了解了指数的基本概念之后,我们来看一下指数都有哪些类型。首先如果按照指数所代表的范围不同,我们可以将指数分为个体指数和总体指数。个体指数就是针对单独某一个个体,可以是某个商品的价格或者某个产品的质量,都可以叫做个体指数;当个体不足以反映整体系统变化的情况时,就需要将个体融合然后用一个总体指数来代表整个系统的状态,这个就是总指数,如居民消费价格指数。


既然总体指数是将个体指数融合之后得到一个数值,那么如何将个体指数加工整理成总体指数,最终得到我们想要的能够代表整个系统状态的一个值呢?


以营商环境指数为例,基本流程是这样的:


这里面可能有的人会问了,每个个体都代表不同的方向,比如企业开办流程个数、办结时间、所需费用,个体的计量单位都不一样,怎么能放到一起做加减乘除的运算呢。其实,这里就用到统计学的知识“数据标准化”的过程。


数据标准化的核心是通过某种规则去掉不同的计量单位,让这些指标在同一个标准规则下进行基本运算,这样一来时间、个数和费用就可以直接进行加减了。


是不是很神奇,那么这么神奇的标准化过程是怎么处理的呢?其实很简单,其中有一种处理方法就叫做前沿距离法(Distance to Frontier,DTF),前沿距离通俗的理解就是:当前水平与最好和最差水平的差别。

举个例子,比如一个班上的期中考试成绩出来了,小明得了 65 分,父亲知道后非常生气,数落了小明一顿,怎么刚刚及格;这个时候小明告诉父亲,班里最高分 70,最低分 15,父亲顿时气就消了一大半;我们看下,65 分距离最好的仅差了 5 分,距离最差的高出了整整 50 分;按照前沿距离来看下小明的成绩指数情况,成绩指数=(65-15)/(70-15)=91 分!


相信大家已经大概了解前沿距离是怎么回事了,其核心就是通过水平与距离的相对数将计量单位归一成分值,而这个分值总会在 0-100 之间,具体的公式如下:


正向指标:


负向指标:


正向指标的得分越大说明整体向好,比如企业开办的便利度,得分越高说明企业开办的便利程度越高;而负向指标则正好相反,数值越高越不利于整体指数的向好发展,比如办理纳税中的纳税次数、纳税时间等,但是通过前沿距离的转化,最后会将负向指标转换成得分,得分越高说明负向指标的数值越小,这样一来就可以统一通过得分来评价该指标的好坏。


上面介绍了如何将不同计量单位的指标统一转化为得分的过程,下一步就是将这些得分进行汇总,最终生成一个总指数;就像我们拿到了数学、语文、英语的成绩,要算最终的总成绩一样,不过区别在于,考试成绩可以直接加和进行排名的对比,而总指数则需要通过加权处理,加权处理就是把每个个体指数的得分赋予一个权重,然后通过得分与权重的加成最终得到总体指数,总体指数是将所有信息压缩成一个 0-100 范围内的最终得分;这个过程有几种方法:算数平均法、几何平均法、加权平均法等等,每种计算权重的详细过程会在下一篇中详细介绍,不是本篇的主要内容。


熟悉了指数的加工过程,我们来看下指数最终的应用。经济领域和国家政务领域对指数十分重视,如道琼斯指数、消费物价指数、行业景气指数等,这些指数不仅会影响市场经济活动,也同时为国家制定相关政策提供重要参考;除此之外,市场中也出现了很多头部企业开始挖掘指数的价值。


头部企业引领某个行业或领域的发展,因为其所从事的业务框架复杂程度非常高,而且创新已经没有可参考的对象;而指数作为风向标,最能够代表某个行业或领域的整体发展情况,因此很多头部公司推出了指数的产品化应用。


应用比较广泛的指数化产品,如:

  • 1.百度指数

百度指数的理想是“让每个人都成为数据科学家”,以百度海量网民行为数据为基础,通过搜索某个关键词来查看一段时间内的涨跌态势以及相关的新闻舆论变化,帮助用户优化数字营销活动方案。

  • 2.阿里指数(针对电子商务平台市场动向的数据分析平台)

阿里指数是了解电子商务平台市场动向的数据分析平台,包括市场行情、热门行业、企业分析等功能,阿里指数将会顺利成为中国电子商务市场的一个关键的晴雨表。

  • 3.360 指数

360 指数是基于其海量用户数据为基础的大数据展示平台,可通过搜索关键词,快速获取热度趋势、理解用户真实需求、了解关键字搜索的人群属性。

  • 4.搜狗指数

搜狗指数平台是以搜狗搜索海量网民行为数据为基础的数据分析统计平台,可以查看全网热门事件、品牌、人物等查询词的搜索热度变化趋势,掌握网民需求变化。

写在最后

政务领域的业务复杂度远高于市场活动,国家会通过编制一些指数来评价某个方向的整体情况,比如用来评价放管服改革、六稳六保等效果的营商环境指数;从另外一个层面来理解,如果我国的营商环境得分在世界范围内都占有很大优势的话,其实也从侧面证明中国的制度体制上的先进性。单从这一点上来看,也不难理解为何国家层面如此重视营商环境的治理了,因为它已经不仅仅代表经济领域的优劣排名,更是带有一种政治战略,为中国在国际社会上的影响力添砖加瓦。


本文转载自:金科优源汇(ID:jkyyh2020)

原文链接:指数之美

2021-04-07 08:002169

评论

发布
暂无评论
发现更多内容

toB行业知识管理的重要性

Baklib

[极致用户体验] 2行代码,让你的UI适配移动端、PC端,快来收藏

HullQin

CSS JavaScript html 前端 8月月更

聊聊 npm 的语义化版本(Semver)

冴羽

JavaScript 前端 npm 项目开发 semver

学术加油站|面向HTAP数据库的基准评测工具研究进展

OceanBase 数据库

超全面!字节最新发布22年秋招200道Java面试题(含答案)

Java面试那些事儿

Java 编程 面试 后端 架构师

手把手地教你如何建立最好的知识管理体系

Baklib

爆肝!阿里大佬熬夜38天整合的这份Spring Security源码手册我粉了

Java全栈架构师

Java 程序员 面试 程序人生 springsecurity

堡垒机可以管理哪些网络资产?咨询电话多少?

行云管家

网络安全 数据安全 堡垒机

高性能实战Alibaba Sentinel笔记,深度还原阿里微服务高并发方案

小柴说Java

Java 编程 架构 面试 后端

听潮汐,筑灯塔,聚千帆:智慧港口全球创新实验室启航时

脑极体

你可能不知道,自动化元数据管理的“七宗最”?

雨果

元数据

云堡垒机和软件堡垒机哪个好?区别是什么?

行云管家

网络安全 数据安全 堡垒机 云堡垒机

完整实现-通过DelayQueue实现延时任务

字母哥哥

Java 架构 并发编程 后端

怎样设计一个协助中心来帮助你的顾客?

Baklib

从一条更新SQL的执行过程窥探InnoDB之REDOLOG

京东科技开发者

MySQL 数据库

数据透视表上线!如何在纯前端实现这个强大的数据分析功能?

葡萄城技术团队

前端

低/无代码的发展将显著改变银行开发生态

易观分析

代码 银行

非科班出身,开发五年之后我对编程有了新的领悟

Java永远的神

Java 编程 程序员 程序人生 计算机

这么好用的接口工具,请允许我油腻一次!

Liam

Java 开发 Postman API 开放api

重磅揭秘!10分钟10TB数据跨云、跨地域传输的技术实践

星汉未来

云原生 数据迁移 东数西算 星汉未来

新手指南|帮助中心应该包含哪些内容?

Geek_da0866

哪些数据被纳入元数据管理的范畴?

雨果

元数据

前端培训就业后的程序员就业方向有哪些?

小谷哥

一对一直播系统源码——如何只需三步搭建

开源直播系统源码

软件开发 一对一直播源码 直播系统源码 一对一直播系统

阿里云AIoT物联网平台技术集锦

阿里云AIoT

数据挖掘 运维 监控 物联网 消息中间件

题目新颖,内容全面!阿里巴巴又一Java面试神册开源!

Java永远的神

Java spring 程序员 面试 JVM

StarRocks 技术内幕:向量化编程精髓

StarRocks

延时任务-基于netty时间轮算法实现

字母哥哥

Java 架构 后端 Netty

开源流式湖仓服务 Arctic 详解:并非另一套 Table Format

网易数帆

大数据 iceberg Hudi Arctic

一文看懂流程挖掘是如何工作的

望繁信科技

指数之美_文化 & 方法_金科优源汇_InfoQ精选文章