写点什么

在 Amazon SageMaker Service 中使用 R 绘制统计过程控制图(SPC)实现流程稳定性预警

  • 2020-09-24
  • 本文字数:1724 字

    阅读完需:约 6 分钟

在 Amazon SageMaker Service 中使用 R 绘制统计过程控制图(SPC)实现流程稳定性预警

在实际的运营场景中,我们可以通过统计过程控制图(SPC:Statistical Process Control Chart)监控运营过程的稳定性,对过程存在的异常因素进行预警,以实现故障减少,用户体验提升和运营成本降低的目的。本文将介绍如何在 Amazon SageMaker Service 中,通过 R 语言来绘制统计过程控制图,从而可视化监控运营过程数据。

什么是统计过程控制图?

统计过程控制图是应用统计技术对过程中的各个阶段进行评估和监控,用来检测过程是否处于可控状态,具有区分正常波动和异常波动的功能图表。如下图所示,在 UCL(控制上限 Upper Control Limit)和 LCL (控制下限 Lower Control Limit)范围之外的波动属于异常波动,而范围之内的波动则属于正常波动。


基于不同的数据类型的控制图分类

使用 R 在 AWS SageMaker Service 中绘制统计过程控制图

样例数据及代码下载


Amazon SageMaker 笔记本实例使用预装的 R 内核支持 R。


Amazon SageMaker的R用户指南


  • 创建笔记本实例,然后单击 Open Jupyter。



  • 从可用的环境列表中创建一个具有 R 内核的新笔记本。



  • 从 S3 中导入数据


R 内核具有reticulate库,提供 R 到Amazon SageMaker Python SDK的接口。reticulate 程序包在 R 和 Python 对象之间转换。


library(reticulate)


py_install('pandas')


py_install('fsspec')


py_install('s3fs')


py_install('xlrd')


pandas <- import('pandas')


data_location <- 's3://sagemaker-xxx/ControlChart/01_I_MR.xlsx'


data<-pandas$read_excel(data_location)


head(data)



data_location_2 <- 's3://sagemaker-xxx/ControlChart/02_U_P_Chart.xlsx'


data2<-pandas$read_excel(data_location_2)


head(data2)



  • 场景一: 运营经理想要了解包装流程的周期时间以及流程的稳定性,从而对包装流程进行效率的提升以及稳定性的优化。


数据源:01_I_MR


数据描述:Cycletime 每件商品的包装周期时间


数据类型:连续型, 数据未分组


图表类型:I-MR,Individual Chart


install.packages('SixSigma',dependencies=TRUE)


library(SixSigma)


require(qcc)


Cycletime = data$Cycletime


Cycletime.xbar.one <- qcc(Cycletime,type='xbar.one')



如图所示,平均包装时间为 49.34s,存在两个异常波动,需进行排查采取措施保证流程节拍的稳定性。


  • 场景二: 供应商运输的货物偶尔会存在一些问题,例如:未扫码,地址发送错误等等,只要货物存在一种问题,则视为存在缺陷。运营经理希望通过 SPC 来了解当前供应商提供的货品质量情况,并予以控制,以提高货品质量。


数据源:02_U_P_Chart


数据描述:SampleSize 抽样数量; Defects_No 缺陷品数量


数据类型:属性数据,单位缺陷


图表类型:U chart


defectno<-data2$Defects_No


samplesize<-data2$SampleSize


with(data2,


plot(qcc(defectno,type='u',samplesize))


)



如图所示,每批货物缺陷率平均为 21.15%,无异常波动。


  • 当发现异常情况后,结合统计分析方法,如:鱼骨图,流程图,图解分析,假设检验,实验设计等逐层过滤出对异常情况造成影响最大的根本原因,对其实施干预并验证效果,从而实现流程持续优化,提升用户体验。


总结

过程控制图可以帮助我们透明化过程情况以及监控过程稳定性,从而识别异常情况,及时预警实施干预。


通过本文,您已了解在不同的运营场景下,如何使用 R 语言在 SageMaker 中绘制不同类型的过程控制图。您也可以结合其他的 AWS 解决方案,如:AWS Data Lake,AWS IoT 等对过程数据进行实时监控和预警以降低故障,提升流程效率,以实现精益化运营。


参考:


[1] Emilio L. Cano • Javier M. Moguerza Andrés Redchuk (2012). SixSigma with R Statistical Engineering for Process Improvement


[2] CRAN – Package SixSigma


https://cran.r-project.org/web/packages/SixSigma/index.html


[3] qcc:Quality Control Charts


https://cran.r-project.org/web/packages/qcc/index.html


作者介绍


崔悦


AWS 大数据顾问,负责数据驱动企业,数字化运营等方案的应用和推广。曾担任 IBM 商务智能顾问,BMW 高级数据分析师,京东推荐产品经理,在电商,零售,汽车等领域拥有多年数据挖掘经验。


本文转载自亚马逊 AWS 官方博客。


原文链接


在 Amazon SageMaker Service 中使用 R 绘制统计过程控制图(SPC)实现流程稳定性预警


2020-09-24 14:07980

评论

发布
暂无评论
发现更多内容

远程办公经验 | 社区征文

弑着去忘记う

初夏征文

远程办公经验分享 | 社区征文

Geek_ac6fb9

初夏征文

【LeetCode】 极大极小游戏Java题解

Albert

LeetCode 6月月更

C#入门系列(十一) -- 多维数组

陈言必行

C# 6月月更

为什么使用 Golang 进行 Web 开发

宇宙之一粟

golang 6月月更

Sealem Finance打造Web3去中心化金融平台基础设施

股市老人

有哪些ABAP关键字和语法,到了ABAP云环境上就没办法用了?

Jerry Wang

云原生 SAP abap Netweaver 6月月更

Fabric.js 动态设置字号大小 🎄

德育处主任

canvas 前端可视化 FabricJS Fabric.js 6月月更

【高并发】关于线程池,蚂蚁金服面试官问了我这些内容!!

冰河

并发编程 多线程 高并发 异步编程 6月月更

循环结构语句

Jason199

js 循环语句 6月月更

InfoQ 极客传媒 15 周年庆征文|容器运行时技术深度剖析

liuzhen007

容器 运维 热门活动 InfoQ极客传媒15周年庆

Es6新特性——箭头函数

大熊G

JavaScript 前端 6月月更

spring的BeanFactory和ApplicationContext

程序员欣宸

Java spring 6月月更

快手处置超过5.4万个违规账号:如何打击平台上的违规账号

石头IT视角

自动化测试系列

IT蜗壳-Tango

6月日更 6月月更

Django 介绍与安装

海拥(haiyong.site)

django 6月月更

了解 Vue 生命周期钩子

devpoint

Vue Vue3 钩子函数 vue2 InfoQ极客传媒15周年庆

Web3生态去中心化金融平台——Sealem Finance

EOSdreamer111

在 Amazon SageMaker Service 中使用 R 绘制统计过程控制图(SPC)实现流程稳定性预警_大数据_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章