【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

指数之美

  • 2021-04-07
  • 本文字数:2247 字

    阅读完需:约 7 分钟

指数之美

什么是指数?

用经济学的概念来理解,任何两个数值对比形成的相对数都可以称之为指数,比如用天气的湿度比上温度得出来一个数值,我们取个名字叫温湿比,对这个数值进行监控就得到了一个指数的趋势变化。当然,实际上的指数不仅仅包含这两个指标,可能会有很多,比如营商指数,就包含近 1400 个指标。


指数在不同领域都有应用,上面说的温湿比是天气指数中的重要因子,在零售行业上应用比较广泛。举个例子,温度和湿度会影响蚊虫幼卵的孵化,在一定程度上会直接影响小区周边便利店内花露水的销量,因此很多咨询公司都会参考天气指数为零售公司提供解决方案。


了解了指数的基本概念之后,我们来看一下指数都有哪些类型。首先如果按照指数所代表的范围不同,我们可以将指数分为个体指数和总体指数。个体指数就是针对单独某一个个体,可以是某个商品的价格或者某个产品的质量,都可以叫做个体指数;当个体不足以反映整体系统变化的情况时,就需要将个体融合然后用一个总体指数来代表整个系统的状态,这个就是总指数,如居民消费价格指数。


既然总体指数是将个体指数融合之后得到一个数值,那么如何将个体指数加工整理成总体指数,最终得到我们想要的能够代表整个系统状态的一个值呢?


以营商环境指数为例,基本流程是这样的:


这里面可能有的人会问了,每个个体都代表不同的方向,比如企业开办流程个数、办结时间、所需费用,个体的计量单位都不一样,怎么能放到一起做加减乘除的运算呢。其实,这里就用到统计学的知识“数据标准化”的过程。


数据标准化的核心是通过某种规则去掉不同的计量单位,让这些指标在同一个标准规则下进行基本运算,这样一来时间、个数和费用就可以直接进行加减了。


是不是很神奇,那么这么神奇的标准化过程是怎么处理的呢?其实很简单,其中有一种处理方法就叫做前沿距离法(Distance to Frontier,DTF),前沿距离通俗的理解就是:当前水平与最好和最差水平的差别。

举个例子,比如一个班上的期中考试成绩出来了,小明得了 65 分,父亲知道后非常生气,数落了小明一顿,怎么刚刚及格;这个时候小明告诉父亲,班里最高分 70,最低分 15,父亲顿时气就消了一大半;我们看下,65 分距离最好的仅差了 5 分,距离最差的高出了整整 50 分;按照前沿距离来看下小明的成绩指数情况,成绩指数=(65-15)/(70-15)=91 分!


相信大家已经大概了解前沿距离是怎么回事了,其核心就是通过水平与距离的相对数将计量单位归一成分值,而这个分值总会在 0-100 之间,具体的公式如下:


正向指标:


负向指标:


正向指标的得分越大说明整体向好,比如企业开办的便利度,得分越高说明企业开办的便利程度越高;而负向指标则正好相反,数值越高越不利于整体指数的向好发展,比如办理纳税中的纳税次数、纳税时间等,但是通过前沿距离的转化,最后会将负向指标转换成得分,得分越高说明负向指标的数值越小,这样一来就可以统一通过得分来评价该指标的好坏。


上面介绍了如何将不同计量单位的指标统一转化为得分的过程,下一步就是将这些得分进行汇总,最终生成一个总指数;就像我们拿到了数学、语文、英语的成绩,要算最终的总成绩一样,不过区别在于,考试成绩可以直接加和进行排名的对比,而总指数则需要通过加权处理,加权处理就是把每个个体指数的得分赋予一个权重,然后通过得分与权重的加成最终得到总体指数,总体指数是将所有信息压缩成一个 0-100 范围内的最终得分;这个过程有几种方法:算数平均法、几何平均法、加权平均法等等,每种计算权重的详细过程会在下一篇中详细介绍,不是本篇的主要内容。


熟悉了指数的加工过程,我们来看下指数最终的应用。经济领域和国家政务领域对指数十分重视,如道琼斯指数、消费物价指数、行业景气指数等,这些指数不仅会影响市场经济活动,也同时为国家制定相关政策提供重要参考;除此之外,市场中也出现了很多头部企业开始挖掘指数的价值。


头部企业引领某个行业或领域的发展,因为其所从事的业务框架复杂程度非常高,而且创新已经没有可参考的对象;而指数作为风向标,最能够代表某个行业或领域的整体发展情况,因此很多头部公司推出了指数的产品化应用。


应用比较广泛的指数化产品,如:

  • 1.百度指数

百度指数的理想是“让每个人都成为数据科学家”,以百度海量网民行为数据为基础,通过搜索某个关键词来查看一段时间内的涨跌态势以及相关的新闻舆论变化,帮助用户优化数字营销活动方案。

  • 2.阿里指数(针对电子商务平台市场动向的数据分析平台)

阿里指数是了解电子商务平台市场动向的数据分析平台,包括市场行情、热门行业、企业分析等功能,阿里指数将会顺利成为中国电子商务市场的一个关键的晴雨表。

  • 3.360 指数

360 指数是基于其海量用户数据为基础的大数据展示平台,可通过搜索关键词,快速获取热度趋势、理解用户真实需求、了解关键字搜索的人群属性。

  • 4.搜狗指数

搜狗指数平台是以搜狗搜索海量网民行为数据为基础的数据分析统计平台,可以查看全网热门事件、品牌、人物等查询词的搜索热度变化趋势,掌握网民需求变化。

写在最后

政务领域的业务复杂度远高于市场活动,国家会通过编制一些指数来评价某个方向的整体情况,比如用来评价放管服改革、六稳六保等效果的营商环境指数;从另外一个层面来理解,如果我国的营商环境得分在世界范围内都占有很大优势的话,其实也从侧面证明中国的制度体制上的先进性。单从这一点上来看,也不难理解为何国家层面如此重视营商环境的治理了,因为它已经不仅仅代表经济领域的优劣排名,更是带有一种政治战略,为中国在国际社会上的影响力添砖加瓦。


本文转载自:金科优源汇(ID:jkyyh2020)

原文链接:指数之美

2021-04-07 08:001852

评论

发布
暂无评论
发现更多内容

web服务整理

return

Python Go CGI web服务器 uwsgi

实用机器学习笔记二十三:集成学习之Stacking

打工人!

学习笔记 集成学习 机器学习算法 3月月更

关于千万级学生系统考试的思考

Geek_1b4338

#架构训练营

千万级学生管理系统考试试卷存储方案设计

tom

模块四作业

Mr小公熊

千万级学生管理系统的考试试卷存储方案

凌波微步

「架构实战营」

模块四

blazar

「架构实战营」

模块四作业-设计千万级学生管理系统的考试试卷存储方案

卡西毛豆静爸

「架构实战营」

2022第9周-打动面试官的一点经验

李印

面试 总结思考

[架构实战营]-千万级学生管理系统的考试试卷存储方案

邹玉麒

「架构实战营」

模块八-作业二

hunk

云原生训练营

模块四作业

Geek_ec866b

架构实战营

架构实战营-模块四作业

Leo

架构实战营

千万级学生管理系统考试试卷存储设计

五月雨

架构实战营 「架构实战营」

全链路压测(五):生产全链路压测实施全流程

老张

性能测试 全链路压测 稳定性保障

架构实战营:模块四作业

刘璐

模块九

Only

架构师实战营 「架构实战营」

节省 58% IT 成本,调用函数计算超过 30 亿次,石墨文档的 Serverless 实践

阿里巴巴云原生

阿里云 云原生 函数计算 石墨文档 资源伸缩

架构训练营 模块四

Geek_16d2b8

架构训练营5期

实用机器学习笔记二十二:集成学习之Boosting

打工人!

深度学习 学习笔记 集成学习 机器学习算法 3月月更

千万级学生管理系统的考试试卷存储方案

风中奇缘

架构实战课 「架构实战营」

DDD实战(3):整体工作框架和全局需求分析

深清秋

DDD 软件架构 生鲜电商系统 3月月更

如何在Linux 系统上比较Bash 脚本中的字符串?

Ethereal

如何在 Windows 上使用 NVM 安装 Node.js?

Ethereal

千万级学生管理系统的考试试卷存储方案

smile

架构实战营

千万级学生管理系统Redis存储架构

IT屠狗辈

redis 架构实战营

感受当下-人生意义的思索

李印

自我感悟 生活的意义

PHP 遇见 Serverless,帮你解决这些痛点!

阿里巴巴云原生

php 阿里云 Serverless 云原生

设计微博系统中”微博评论“的高性能高可用计算架构

王大胖

网络工程师必知:三种防火墙链路检测技术:BFD、NQA、IP-link

Ethereal

架构师训练营模块四作业

刘帅

指数之美_文化 & 方法_金科优源汇_InfoQ精选文章