写点什么

四种类型的数据分析模式

  • 2017-07-26
  • 本文字数:1227 字

    阅读完需:约 4 分钟

在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。

当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。

我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解。瑞典统计学家 Hans Rosling 在这方面很有名。这种能力往往被忽略。下面 Hans Rosling 的这个 TedTalk 谈到了这些:

https: // v.qq.com/x/page/g05293tyy78.html

分析能辅助开发有价值的见解,很有必要用一些工具来让人们了解分析所起的作用。其中一种工具是分析四维图。

简单地来说,分析可被划分为 4 个重要的类别。下面我将详细解释这四个类别。

1. 描述型:发生了什么?

这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。

一个例子是每月的利润和损失账单。类似地,分析师可以获得大批客户的数据。了解客户(如,30% 的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的信息。

2. 诊断型:为什么会发生?

这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。

设计良好的商业信息 dashboard 整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

3. 预测型:可能发生什么?

预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。

预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。

在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

这里是预测分析中要避免的前几大陷阱

4. 指导型:我需要做什么?

在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。

交通应用是一个很好的例子,它帮助人们选择最好的回家路线,考虑到了每条路线的距离、在每条路上的速度、以及很关键的目前的交通限制。

另一个例子是生成考试时间表,不让任何学生的时间表发生冲突。

关于作者

Thomas Maydon Principa 公司的信用解决方案部门主管。他在南非、西非和中东地区有着超过 13 年的零售信贷市场的经验,主要参与咨询、分析、信用局和预测模型服务。

查看英文原文 The 4 Types of Data Analytics


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-26 19:005162
用户头像

发布了 21 篇内容, 共 11.0 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

中小企业安全焦虑终结者:腾讯iOA基础版五大场景防护实测

穿过生命散发芬芳

腾讯iOA场景体验官

解码社交媒体监控的战略意义

沃观Wovision

海外舆情监控 沃观Wovision 海外舆情监测

万力轮胎36亿柬埔寨橡胶轮胎项目的RFID技术真相

斯科信息

斯科信息 RFID技术 RFID标签

火山引擎数智平台发布Data Agent"一客一策"与AI数据湖"算子广场"

字节跳动数据平台

大数据 智能体 agent

Grafana无法启动修复解决

天翼云开发者社区

Grafana

SSRF跨协议重定向绕过漏洞分析

qife122

nodejs SSRF

本地MacOS环境连接管理开发者空间 - 云开发环境

华为云开发者联盟

Mac 软件 Linux、 华为开发者空间

OpenLayers与Vue.js结合实现前端地图应用

知识浅谈

地图 openlayers

干货分享!矿产行业指标体系建设与 AI 数智应用全方案解析

袋鼠云数栈

人工智能 指标体系 指标 指标建设 矿产行业

成图大赛 | Altair 助力第十八届“高教杯”全国大学生先进成图技术与产品信息建模创新大赛圆满落幕

Altair RapidMiner

机器学习 仿真 CAE Inspire 结构轻量化

分享背后的设计理念:为什么我们要重新设计工业数据管理平台

TDengine

tdengine 工业数据 idmp

安全认证系列|等保三级达标:ArgoDB筑牢企业安全防线,合规无忧

星环科技

为什么“低代码”要成为新系统的基础能力?

星云低代码中间件

ide 低代码 开发平台 可视化开发

浪浪山小妖怪逆袭记:低代码打造基层数字化转型超能力

中烟创新

基于开发者空间OpenGauss数据库列存引擎的分析与使用

华为云开发者联盟

opengauss AI+ dify 华为开发者空间

生成式AI时代的应用NLP实战策略

qife122

自然语言处理 机器学习

抢占达人营销新高地:如何选对海外社交平台加速品牌出海

Wolink

跨境贸易 海外营销推广 沃链Wolink 达人营销

评估机器翻译模型性别偏见的数据集发布

qife122

机器翻译 数据集

一文读懂:什么是私有化即时通讯?企业为什么要选择私有化

BeeWorks

即时通讯 IM 私有化部署

企业内部办公聊天软件BeeWorks:稳定的IM通讯服务

BeeWorks

即时通讯 IM 私有化部署

2026中国电子展

AIOTE智博会

电子展 深圳电子展 电子信息展 电博会

linux-screen命令使用

天翼云开发者社区

CDN 操作系统 screen

“文件自由”的鸿蒙实践:两个独立开发者与《流舟文件》的破局之旅

最新动态

开发者空间仓颉初体验:开启仓颉语言的神秘大门

华为云开发者联盟

语言开发 仓颉 华为开发者空间

(在线CAD控件)网页CAD与Mapbox结合实现在线地图和CAD编辑

WEB CAD SDK

Altair HyperWorks教程:线性屈曲分析

智造软件

仿真 CAE软件 hyperworks 汽车行业 航空

仓颉基础大揭秘:数据类型的奇妙世界

华为云开发者联盟

CodeArts 仓颉 华为开发者空间

《小K闪电课堂》EP08 :SQL 引擎“第五关”——时序执行器!

KaiwuDB

数据库 KaiwuDB 分布式多模数据库 KWDB开源数据库 数据库教程

Skywork Deep Research Agent重磅升级!带来更多模态、更高质量和更高效的体验

新消费日报

安全认证系列| ArgoDB通过强制性国家标准GB 18030-2022最高级别认证,无缝兼容中文环境

星环科技

四种类型的数据分析模式_语言 & 开发_CarolGuo_InfoQ精选文章