【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

模型预测准确率高达 94%!利用机器学习完美解决 2000 亿美元库存难题

  • 2020-11-07
  • 本文字数:2424 字

    阅读完需:约 8 分钟

模型预测准确率高达94%!利用机器学习完美解决2000亿美元库存难题

本文最初发表于 Towards Data Science 博客,经原作者 Fabrizio Fantini 授权,InfoQ 中文站翻译并分享。


你知道吗?单是在美国,就有价值超过 2 万亿美元的库存每售出 1 美元,就有超过 1.4 美元的库存


这一数字至少超过了 2000 亿美元,甚至可能更多。理由如下。


商品库存通常都是容易腐烂的:有些商品会随着趋势的变化而失去价值;有些商品是季节性的,季节性对需求起着重要作用;有些商品则只是过期了或被浪费掉了;有些商品可能会在货架上存放了更长时间。一切终将消逝。并且,由于所需的财务成本,储备库存无论如何都是很昂贵的。


如今,消费者的选择范围越来越广:他们正在充分利用这种多样性,并变得比以往更有选择性。无论是在 B2B 还是 B2C,都是如此。


新的分析技术应运而生,可以将这种浪费的库存削减 10% 或更多。我已经不止一次这样做了,所以我知道它行得通;那么,这个故事中最吸引人的地方在哪里?


>最好的解决方案不只是机器学习,而是将机器学习与人类输入结合起来。


让我们继续阅读,来了解我那难以置信的经历。


回顾与展望


造成库存过剩的根本原因很简单:供应链之所以缓慢,是因为它们需要回顾。是的,即使到了 2020 年,即使暴发了新冠肺炎疫情,根本问题仍然没有改变。



许多公司仍然使用传统的目标库存水平(Target Stock Level,TSL)模型来驱动库存决策。它是一个复杂的概念,即“卖一得一”——世界补给的字面意思。此外,需求的高度不确定性要求库存管理者在安全库存利润方面高于其他必要情况。


推动库存,而不是让市场需求来拉动:这会导致大量库存无法在产品生命周期末销售,同时也会带来高昂的仓储成本。


要如何才能准确地提前设定这样的目标库存水平,并做到每日更新呢?


市场的季节性和*不可预测性*,在新冠肺炎疫情中变得尤为明显,这就需要新的模型:预测每种产品的需求,实时了解如何纳入新的市场因素,并制定相应的规则,以使其始终得到正确执行。


这些示例规则可以包括供应链调度、产品重新订购的频率、从订购时起接受新产品的预定期、最小订购数量、供应商可靠性和成本结构(生产、运输、管理)。


>现在,“回顾过去”的意思是实际地囤积过去售出过的东西。


就像去年,或者上个月。


>“展望未来”的意思是实际地储备预期将来要出售的东西。


听起来很相似,但是却有很大的不同之处。有一种情况是,管理人员需要手动设定目标并审查规则。而另一方面,客户直接通过数据和系统来推动决策。自主地进行。那管理方面呢?


利用机器学习解决 2000 亿美元的问题


关于这一问题,我了解得越多,就越意识到,没有单一的答案。太多特定于上下文的业务规则、与位置相关的变量,以及不同商品、大小、时间等之间的销售差异。因此,我不再专注于回答任何单一的问题。取而代之的是,我开始用一个动态的工具来代替传统的 TSL,它专注于动态机器学习。


为了测试,我尝试了 6 种不同的 B2C 补货方式:



假设我们知道商店之间的需求分布,并且我们为每家商店分配了 20% 的平均变化率,为了简单起见,在此期间不会有折扣或促销活动。


进一步说明的结果表明,机器学习的性能比传统的 TSL 方法高出了 9~25 个百分点。


惊人的增加?那是因为人类管理者的输入


如果商店经理编辑他们自己的由机器生成的库存分配建议时,结果甚至会进一步得到改善。事实上,当机器和商店经理一起合作时,该模型的预测结果达到了 94% 的理论完美销售业绩。



在这个实验中,下图显示了已售出商品件数所占的百分比,它取决于当时满足总需求的库存能力。



正如你在上图看到的,为了满足 100% 的需求,随着预测误差的增加,你需要更多的库存。例如,凭借完美的预测,你可以用 100% 的库存实现 100% 的潜在销售额。但是,逐渐地,较差的方法需要 120%、140% 等等。这就是为什么在美国,每 1 美元的销售额就有超过 1.40 美元的平均库存!


下图显示了在所述期间结束时的剩余数量:



如果总可用性低于(或高于)给定期间的需求,那么动态 TSL 将在总库存覆盖率的 10% 时就会脱离总预测结果的基准曲线,从而导致缺货问题。这种偏离理想行为的情况在有人类输入的情况下发生在 60% 处,在没有人类输入的情况下发生在 30% 处,而在实施静态补货政策时,这种情况几乎是立即发生的。


预测的正确率越低,每条销售曲线的趋势就越平缓,且离二等分线越远,如下图所示,静态 TSL 会导致整体损失约 63%。



关键知识


一些真正有趣的,尽管是技术性的见解(嘿,这毕竟是 TDS!):


  • 静态库存分配几乎从来就不是一件好事,它简直就是一件糟糕的事情。在某些地方,它很少能够满足需求,而其他地方,最终的库存量却太多。

  • 像传统的 TSL 这样简单的预测并不足以从现有库存中获得最大的利润。生成最优库存预测的唯一有效方法是定期向模型输入新数据,这样它就能够学习并优化自己的计算。

  • 人工智能本身并不能达到人工智能和人类专家共同合作的水平。当员工可以输入他们自己的业务规则,指定他们自己的补货结果并对结果进行评分时,人工智能的表现就非常接近于回顾中产生的“完美预见”的库存分配,从而为每家商店的每个商品带来高度优化的库存水平。


目标库存水平(TSL)创建一个固定的、定期的供应订单。但是,随着过剩的库存导致利润的浪费,其局限性也变得明显。


当你考虑到这些旧的库存管理系统使用哪些因素来确定要订购多少库存时,这样的限制就不足为奇了。简而言之,答案就是历史数据。这一切都很好,但是,它却忽略了那些非常重要的外在因素,比如市场趋势、市场竞争。以及天气(对英国人来说是众所周知的棘手话题)。


传统的库存管理解决方案使用公式来获得静态数字。但是,这真的是前进的方向吗?


依靠公式来应对需求不仅不够灵活,而且还会破坏商业价值。


这些基于公式的传统库存管理解决方案以公司为中心,并没有考虑到客户通过网络、社交媒体和竞争对手市场所表达的观点。


作者介绍:


Fabrizio Fantini,博士兼首席执行官,致力于数十亿人类的科学。


原文链接:


https://towardsdatascience.com/94-perfect-the-surprising-solution-to-the-200-billion-inventory-problem-b6ba0bc1417a


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-11-07 09:003476
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.5 次阅读, 收获喜欢 1968 次。

关注

评论 1 条评论

发布
用户头像
人工智能要取代人类,还有很长的路要走。更多的可能是,人工智能成为人类不可或缺的工具,以至于不再视为人工智能。比如OCR。
2020-11-09 19:06
回复
没有更多了
发现更多内容

7万张H100打造的Open AI文生视频Sora功能原理详解|Sora注册全攻略

蓝海大脑GPU

比特币价格突破62000美元,近一个月涨幅超过40%

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

OpenMLDB v0.8.5 发布:认证功能完善,安全升级全面实施

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

探索基于Stable Diffusion的智能绘画大模型

百度开发者中心

人工智能 深度学习 图像 大模型

用户使用433MHz无线模块时,出现偶尔无法收发数据的原因?

Geek_ab1536

iPaaS如何实现安全通信保障

RestCloud

信息安全 ipaas

对比传统主机,云主机贵吗?是否值得购买?

一只扑棱蛾子

云主机

京东商品详情数据获取item_get-获得JD商品详情,Java请求示例API接口

Anzexi58

关于Python中math 和 decimal 模块的解析与实践

华为云开发者联盟

Python 开发 华为云 华为云开发者联盟

大模型+搜索:构建完整技术栈,为企业定制化注入新活力

百度开发者中心

数字 大模型 人工智能、

WPF性能优化:性能分析工具

EquatorCoco

性能优化 服务器 WPF

盘点6个最受欢迎的 Vue.js UI 库

秃头小帅oi

什么是渗透测试?有哪些类型?

小齐写代码

干货!Windbg 在 TDengine 内存泄漏调试中的应用与实践分享

TDengine

tdengine 时序数据库 内存泄漏 windbg

骚操作之 持有 ReadOnlySpan 数据

八苦-瞿昙

C#

BEANZ NFT 概览与数据分析

Footprint Analytics

blockchain NFT

抖音技术分享:飞鸽IM桌面端基于Rust语言进行重构的技术选型和实践总结

JackJiang

网络编程 即时通讯 IM

JAVA请求示例获取1688商品详情数据API接口item_get-获得阿里巴巴商品详情(按关键词搜索商品列表)

Anzexi58

API 文档

多种方式获取淘宝商品详情数据,关键词搜索商品列表,店铺ID获取店铺所有商品,按图搜索获取商品详情数据

Anzexi58

API 文档

抢占市场先机:利用API商品数据接口激活您的数据资产

Noah

IDC 中搭建 Serverless 应用平台:通过 ACK One 和 Knative 玩转云资源

阿里巴巴云原生

阿里云 云原生 容器服务

【数字永生】SaaS系统源码独立部署,行业独家!

青否数字人

数字人

奇点云:SAFe框架下,我们对平台软件工程生产线做了4项改造

奇点云

大数据平台 制造业 奇点云

请求示例JAVA获取淘宝商品详情数据API接口item_get-获得淘宝商品详情(按关键词搜索商品列表)

Anzexi58

API 文档

J17资本合伙人SKY LAI确认出席Hack .Summit() 2024区块链开发者盛会

TechubNews

立即报名|3 月 8 日北京,稳定性 & 可观测沙龙来了!

阿里巴巴云原生

阿里云 容器 微服务 云原生

可用于智能客服的完全开源免费商用的知识库项目

不在线第一只蜗牛

架构 开源项目 技术栈 智能客服

文生视频Sora模型发布,是否引爆AI芯片热潮

申公豹

人工智能

L2 网络 Mint Blockchain 正式对外发布测试网

NFT Research

blockchain NFT 测试网络

互联网大厂面试题解析之大疆一面

派大星

Java 面试题 互联网大厂面试

模型预测准确率高达94%!利用机器学习完美解决2000亿美元库存难题_AI&大模型_Fabrizio Fantini_InfoQ精选文章