写点什么

四种类型的数据分析模式

  • 2017-07-26
  • 本文字数:1227 字

    阅读完需:约 4 分钟

在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。

当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。

我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解。瑞典统计学家 Hans Rosling 在这方面很有名。这种能力往往被忽略。下面 Hans Rosling 的这个 TedTalk 谈到了这些:

https: // v.qq.com/x/page/g05293tyy78.html

分析能辅助开发有价值的见解,很有必要用一些工具来让人们了解分析所起的作用。其中一种工具是分析四维图。

简单地来说,分析可被划分为 4 个重要的类别。下面我将详细解释这四个类别。

1. 描述型:发生了什么?

这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。

一个例子是每月的利润和损失账单。类似地,分析师可以获得大批客户的数据。了解客户(如,30% 的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的信息。

2. 诊断型:为什么会发生?

这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。

设计良好的商业信息 dashboard 整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

3. 预测型:可能发生什么?

预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。

预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。

在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

这里是预测分析中要避免的前几大陷阱

4. 指导型:我需要做什么?

在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。

交通应用是一个很好的例子,它帮助人们选择最好的回家路线,考虑到了每条路线的距离、在每条路上的速度、以及很关键的目前的交通限制。

另一个例子是生成考试时间表,不让任何学生的时间表发生冲突。

关于作者

Thomas Maydon Principa 公司的信用解决方案部门主管。他在南非、西非和中东地区有着超过 13 年的零售信贷市场的经验,主要参与咨询、分析、信用局和预测模型服务。

查看英文原文 The 4 Types of Data Analytics


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-26 19:004829
用户头像

发布了 21 篇内容, 共 10.4 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

【等保小知识】等保、分保以及关保分别是什么意思?

行云管家

网络安全 等保 等级保护 分保

网易智企斩获“2021全球新经济卓越成就奖”两项大奖

网易云信

大数据 云通信 通信云

不懂乐理和五线谱也能快速入门电子音乐制作!用FL Studio 搞音乐创作有时候就是这么简单!

懒得勤快

Linux 系统资源查看及硬件故障排查(qbit)

qbit

操作系统 故障 资源

dubbo 配置 loadbalance 不生效?撸一把源码

捉虫大师

dubbo

Apache ShenYu源码阅读系列-基于Http长轮询的数据同步

子夜2104

网关 shenyu

APP与小程序,相爱相杀

Speedoooo

容器 ios开发 APP开发 Andriod开发

《黑客之道》- kali LInux之WireShark抓包及常用协议分析

学神来啦

网络安全 Wireshark 渗透 kali

pygame 中的图形绘制函数、帧速率和文字相关知识,简单的的不得了

梦想橡皮擦

11月日更

实现连续测试,要做的事情【译】

FunTester

敏捷 自动化 持续集成 FunTester 连续测试

【Redis技术专题】分析一下Redission实现分布式锁的点点滴滴

码界西柚

redis redission redisson 分布式锁 11月日更

闻香识代码,什么是衡量代码质量的终极标准?

Zilliz

Java 代码质量 JavaScrip

拍乐云基于AV1的实时视频系统技术实践 | 2021 LiveVideoStackCon 演讲回顾

拍乐云Pano

音视频 WebRTC RTC

30K成功入职京东:拿到京东offer经验分享「面试经历+面试真题」

Java redis spring 程序员 JVM

「The Monthly Echo」十月社区成长回顾

SphereEx

数据库 开源 ShardingSphere 技术沙龙 SphereEx

一分钟带您了解,堡垒机主要功能有哪些?

行云管家

网络安全 服务器 堡垒机 等级保护

当你在跑步时在想什麽? 这个是村上春树的,当你在骑摩托车时在想什麽? 这个是波西格的

叶小鍵

LCN基本原理

平凡人生

恒源云(GpuShare)_【功能更新】镜像市场上线

恒源云

深度学习

lims实验室信息监控管理系统解决方案

低代码小观

企业管理 管理系统 LIMS实验室信息管理系统 LIMS系统 信息管理系统

公司刚来的阿里p8,看完我构建的springboot框架,甩给我一份文档

Java 编程 程序员 Spring Boot

MRS HetuEgine的数据虚拟化实践

华为云开发者联盟

大数据 数据湖 云原生 华为云 数据虚拟化

拥有3000多万用户的录屏软件,到底强在哪儿?

淋雨

Camtasia

WeTest六周年 | 匠心不改 初心不变

WeTest

手把手教你从零开始搭建个人博客,20分钟上手

老表

Hexo 个人博客 服务器 教程分享 11月日更

如何快速搞定第三方登录且易扩展?

Tom弹架构

Java 架构 设计模式

极客 - 大数据 - 作业 Flink

西伯利亚鼯鼠

Android技术分享| Android WebRTC 开启H264软件编解码教程

anyRTC开发者

android 音视频 WebRTC ffmpeg H264

03 K8S之网络互联通信

穿过生命散发芬芳

k8s 11月日更

增量编译:让小程序包编译速度提升11倍!

Speedoooo

容器 ios开发 APP开发 Andriod开发

APP上跑小程序,一箭双雕

Speedoooo

ios开发 APP开发 Andriod开发

四种类型的数据分析模式_语言 & 开发_CarolGuo_InfoQ精选文章