写点什么

指数之美

  • 2021-04-07
  • 本文字数:2247 字

    阅读完需:约 7 分钟

指数之美

什么是指数?

用经济学的概念来理解,任何两个数值对比形成的相对数都可以称之为指数,比如用天气的湿度比上温度得出来一个数值,我们取个名字叫温湿比,对这个数值进行监控就得到了一个指数的趋势变化。当然,实际上的指数不仅仅包含这两个指标,可能会有很多,比如营商指数,就包含近 1400 个指标。


指数在不同领域都有应用,上面说的温湿比是天气指数中的重要因子,在零售行业上应用比较广泛。举个例子,温度和湿度会影响蚊虫幼卵的孵化,在一定程度上会直接影响小区周边便利店内花露水的销量,因此很多咨询公司都会参考天气指数为零售公司提供解决方案。


了解了指数的基本概念之后,我们来看一下指数都有哪些类型。首先如果按照指数所代表的范围不同,我们可以将指数分为个体指数和总体指数。个体指数就是针对单独某一个个体,可以是某个商品的价格或者某个产品的质量,都可以叫做个体指数;当个体不足以反映整体系统变化的情况时,就需要将个体融合然后用一个总体指数来代表整个系统的状态,这个就是总指数,如居民消费价格指数。


既然总体指数是将个体指数融合之后得到一个数值,那么如何将个体指数加工整理成总体指数,最终得到我们想要的能够代表整个系统状态的一个值呢?


以营商环境指数为例,基本流程是这样的:


这里面可能有的人会问了,每个个体都代表不同的方向,比如企业开办流程个数、办结时间、所需费用,个体的计量单位都不一样,怎么能放到一起做加减乘除的运算呢。其实,这里就用到统计学的知识“数据标准化”的过程。


数据标准化的核心是通过某种规则去掉不同的计量单位,让这些指标在同一个标准规则下进行基本运算,这样一来时间、个数和费用就可以直接进行加减了。


是不是很神奇,那么这么神奇的标准化过程是怎么处理的呢?其实很简单,其中有一种处理方法就叫做前沿距离法(Distance to Frontier,DTF),前沿距离通俗的理解就是:当前水平与最好和最差水平的差别。

举个例子,比如一个班上的期中考试成绩出来了,小明得了 65 分,父亲知道后非常生气,数落了小明一顿,怎么刚刚及格;这个时候小明告诉父亲,班里最高分 70,最低分 15,父亲顿时气就消了一大半;我们看下,65 分距离最好的仅差了 5 分,距离最差的高出了整整 50 分;按照前沿距离来看下小明的成绩指数情况,成绩指数=(65-15)/(70-15)=91 分!


相信大家已经大概了解前沿距离是怎么回事了,其核心就是通过水平与距离的相对数将计量单位归一成分值,而这个分值总会在 0-100 之间,具体的公式如下:


正向指标:


负向指标:


正向指标的得分越大说明整体向好,比如企业开办的便利度,得分越高说明企业开办的便利程度越高;而负向指标则正好相反,数值越高越不利于整体指数的向好发展,比如办理纳税中的纳税次数、纳税时间等,但是通过前沿距离的转化,最后会将负向指标转换成得分,得分越高说明负向指标的数值越小,这样一来就可以统一通过得分来评价该指标的好坏。


上面介绍了如何将不同计量单位的指标统一转化为得分的过程,下一步就是将这些得分进行汇总,最终生成一个总指数;就像我们拿到了数学、语文、英语的成绩,要算最终的总成绩一样,不过区别在于,考试成绩可以直接加和进行排名的对比,而总指数则需要通过加权处理,加权处理就是把每个个体指数的得分赋予一个权重,然后通过得分与权重的加成最终得到总体指数,总体指数是将所有信息压缩成一个 0-100 范围内的最终得分;这个过程有几种方法:算数平均法、几何平均法、加权平均法等等,每种计算权重的详细过程会在下一篇中详细介绍,不是本篇的主要内容。


熟悉了指数的加工过程,我们来看下指数最终的应用。经济领域和国家政务领域对指数十分重视,如道琼斯指数、消费物价指数、行业景气指数等,这些指数不仅会影响市场经济活动,也同时为国家制定相关政策提供重要参考;除此之外,市场中也出现了很多头部企业开始挖掘指数的价值。


头部企业引领某个行业或领域的发展,因为其所从事的业务框架复杂程度非常高,而且创新已经没有可参考的对象;而指数作为风向标,最能够代表某个行业或领域的整体发展情况,因此很多头部公司推出了指数的产品化应用。


应用比较广泛的指数化产品,如:

  • 1.百度指数

百度指数的理想是“让每个人都成为数据科学家”,以百度海量网民行为数据为基础,通过搜索某个关键词来查看一段时间内的涨跌态势以及相关的新闻舆论变化,帮助用户优化数字营销活动方案。

  • 2.阿里指数(针对电子商务平台市场动向的数据分析平台)

阿里指数是了解电子商务平台市场动向的数据分析平台,包括市场行情、热门行业、企业分析等功能,阿里指数将会顺利成为中国电子商务市场的一个关键的晴雨表。

  • 3.360 指数

360 指数是基于其海量用户数据为基础的大数据展示平台,可通过搜索关键词,快速获取热度趋势、理解用户真实需求、了解关键字搜索的人群属性。

  • 4.搜狗指数

搜狗指数平台是以搜狗搜索海量网民行为数据为基础的数据分析统计平台,可以查看全网热门事件、品牌、人物等查询词的搜索热度变化趋势,掌握网民需求变化。

写在最后

政务领域的业务复杂度远高于市场活动,国家会通过编制一些指数来评价某个方向的整体情况,比如用来评价放管服改革、六稳六保等效果的营商环境指数;从另外一个层面来理解,如果我国的营商环境得分在世界范围内都占有很大优势的话,其实也从侧面证明中国的制度体制上的先进性。单从这一点上来看,也不难理解为何国家层面如此重视营商环境的治理了,因为它已经不仅仅代表经济领域的优劣排名,更是带有一种政治战略,为中国在国际社会上的影响力添砖加瓦。


本文转载自:金科优源汇(ID:jkyyh2020)

原文链接:指数之美

2021-04-07 08:002095

评论

发布
暂无评论
发现更多内容

LoRA:语言模型微调的计算资源优化策略

Baihai IDP

人工智能 深度学习 程序员 AI LLM

业务架构师之路

执于业务

架构师 业务 业务架构师

快速上手极狐GitLab设计管理功能

极狐GitLab

文心一言 VS 讯飞星火 VS chatgpt (195)-- 算法导论14.3 3题

福大大架构师每日一题

福大大架构师每日一题

打破信息孤岛,聚道云软件连接器助力企业实现高效管理

聚道云软件连接器

案例分享

Wireshark使用技巧

小齐写代码

流批一体化数据加工处理之记录过滤

大河

2024年1月文章一览

codists

iOS平台如何实现毫秒级延迟的RTMP|RTSP播放器

音视频牛哥

IOS RTSP播放器 IOS RTMP播放器 RTSP播放器 RTMP播放器 RTMP player

代码手术刀-自定义你的代码重构工具

京东零售技术

Java 源码分析 后端 代码重构

2023年12月文章一览

codists

codists

华为视频走近《鲁豫有约一日行》,看技术如何赋能艺术创作

最新动态

对话苏光牛:国内数据库市场已进入关键转折点,2024年或是分水岭

华为云开发者联盟

数据库 后端 华为云 华为云GaussDB 华为云开发者联盟

【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的API网关设计实现

码界西柚

性能优化 架构设计 高性能网关 亿级数据 2024年第三十三篇文章

听GPT 讲Rust Tokio源代码(3)

fliter

亿级流量高并发春晚互动前端技术揭秘

京东科技开发者

一文详解静态图和动态图中的自动求导机制

百度Geek说

Python 深度学习 自动求导 autodiff

代码验证斯特林公式的准确性

fliter

国内唯一!通义灵码入选全球智能编码助手使用率 TOP 榜单

阿里巴巴云原生

阿里云 云原生 通义灵码

一起畅玩!幻兽帕鲁服务器华为云搭建教程(Windows 平台)

YG科技

听GPT 讲Rust Tokio源代码(2)

fliter

阿里集团基于Fluid+JindoCache加速大模型训练的实践

阿里技术

阿里 大模型 Fluid JindoCache

解密JavaChassis3:易扩展的多种注册中心支持

华为云开发者联盟

Java 开发 华为云 华为云开发者联盟

科蓝软件启动鲲鹏原生应用开发合作

彭飞

低代码,流行的软件开发方式

互联网工科生

软件开发 低代码 JNPF

指数之美_文化 & 方法_金科优源汇_InfoQ精选文章