写点什么

从理论到实践,如何用数据在 AI 时代做出最优决策?

  • 2025-01-23
    北京
  • 本文字数:3948 字

    阅读完需:约 13 分钟

从理论到实践,如何用数据在AI时代做出最优决策?

本文为王曦(前 Google 商业运营主管、杉数科技联合创始人)近日在央视网《中国向新力》栏目发表的演讲全文,围绕数据思维与数字技术展开了探讨。


说到数学和数字技术,我相信大家⾝边⼀定有不少的固有印象:


⽐如很多⼈认为,数学就是整天与枯燥的公式和理论为伍,远离了商业世界的繁华与喧嚣, 但你可能不知道的是,被称为 “华尔街最伟⼤投资者” 之⼀的吉姆 · ⻄⻔斯,其实就是⼀位数学教授;


也有很多⼈认为,数字技术是复杂、抽象、甚⾄颇有些⻔槛的,普通⼈很难搞懂, 但在 170 多年前的野战医院⾥,⼥护⼠南丁格尔⽤⼏张简单的圆形图表,开创了现代护理事业,拯救了⽆数伤员的⽣命;


还有很多⼈认为,有了数字就意味着拥有了客观、真实、准确, 但⻢克 · 吐温也说过:“世界上的谎⾔有三种:谎⾔、该死的谎⾔、和统计数字。”


我⾃⼰就是学数学专业出⾝,也是⼀家智能决策与计算技术公司的创始⼈,所以今天,我想和⼤家⼀起聊聊数字技术 —— 就像哲学⾥ “我是谁,从哪⾥来,到何处去” 的三个基本问题⼀样,我也想⽤亲⾝经历的三个数据思维故事, 和你⼀起来聊聊 “数字技术的价值是什么、它从哪⾥来、要到哪⾥去”。


第⼀个故事, 联合国维和⾏动部,那是 2011 年的盛夏。


时任维和⾏动部部⻓阿兰 · 罗伊 先⽣,突然问了我这样⼀个问题:“当世界上某个地⽅发⽣军事冲突的时候,我们要评估派不派遣维和部队,以及要派多少⼈过去。这个评估⼯作现在通常需要三四个⽉甚⾄更⻓的时间,但如果我给你⾜够多的数据, 你能把这个过程缩短到 1 个⽉之内么?”


如果换作是你,你会怎么做呢?


那时的我,还在斯坦福读博⼠。刚听到这个问题的时候,⼼⾥满是激动和跃跃欲试,感觉⾃⼰⻢上就要去拯救世界了。但仔细想想就会发现,⼀个维和⾏动不仅仅有⼤量的经济成本,还要综合考虑地缘政治、军事冲突、后勤保障、⽣命安全,这么多复杂的因素放在⼀起,还要把时间缩短⼀⼤半,换了谁都不是⼀件容易的事情。


⽽当时的维和⾏动部是如何应对这个问题的呢?它建⽴了⼀个专⻔的信息管理部⻔,搜集整理了⼤量的信息,涉及世界上众多可能发⽣军事冲突的地区,并对各地的历史沿⾰、宗教特点、地区⽭盾等等有助于更好理解地缘冲突的因素进⾏分类和整理,使得危机发⽣的时候,可以快速定位军事冲突的根因,并由此来⽀持维和部队派遣的评估。


不可否认,这的确是⼀件⾮常有意义的⼯作,也让信息处理变得迅速了很多,但很遗憾,要回答维和部⻓提出的问题,这还远远不够。因为这些数据,只被⽤来做了归纳和预测,⽽对于 “派不派、派多少” 这样的决策问题,却⽀持甚少。


⽽这,也是我第⼀次深刻地意识到, 数字技术的核⼼价值,是要能够帮助我们更好地做选择,也就是,解决决策问题。


于是,我帮助维和⾏动部,建⽴了⼀套由数字驱动的维和部队派遣的决策模型,其中,有这样⼏个核⼼的组成部分:

  • 第⼀, ⽤数据扩充可⾏⽅案。 有哪些选择,是⼀个决策问题的关键,⽽在之前,派不派、派多少这类问题的选择范围,是完全由当时的局势快速框定的,既拍脑袋,也⾮常受限。但数据可以告诉我们,历史上还有哪些成功的选项,可以帮助我们扩⼤选择范围;

  • 第⼆,⽤数据细化⻛险评估。⼀个维和⾏动,能否控制住局势、有多少伤亡、能保护多少平⺠,都是未知且瞬息万变的,⽽⽤数据不仅可以帮助预测,还能判断哪些动作值得推迟,以换取更多的新信息,让我们从容应对局势的变化;

  • 第三,⽤数据量化价值评判。⽣命是⽆价的,但资源也是有限的,⽤数据统⼀度量衡,便可以让所有选择结果的“好” 与 “坏”,都能放在⼀起做⽐较。


这套决策模型的建⽴,不仅很好地回应了维和部⻓提出的决策问题,⽽且在整个联合国维和⾏动部,这个模型背后的决策框架也⼀直被沿⽤⾄今。现在回想起来,真的⾮常⾃豪和荣幸。


这就是我的第⼀个故事:它让我意识到数字技术的核心价值是指导决策,也帮助我从⼀个理论研究者,成长为了⼀名数字技术的应⽤者。


第⼆个故事, 2016 年,盛夏的北京,我刚刚回国创业。那时的我,正在思考数字技术价值的第⼆个灵魂拷问:它从何⽽来。


彼时我已经在美国⽣活了⼋年多的时间,在硅⾕最酷的公司,拥有⾃⼰的团队,所以很多⼈问我为什么。原因很简单,我被吸引了。我看到中国的企业在经历了 “⼤数据” 的洗礼之后,都想靠数据驱动产⽣些价值,也看到随着宏观经济增速放缓,传统的铺摊⼦、粗放式的管理和经营⽅式,已经不⾜以⽀撑新的经济阶段下的⾼质量发展。


⽽我希望做的,就是⽤数字技术帮助中国的企业,通过精细化运营实现降本增效,在危机中也能避免⼤过剩与⼤浪费的出现,就像⼈们常说的, “圈⼀块地,种⼀季粮,精耕细作,秋收冬藏”。


所以,如果说数字技术的核⼼价值是指导决策,那么这些决策问题从何⽽来呢?我的答案是,从产业服务中来。


⽽想要服务产业,就必须要先深⼊产业。就拿服务⼯业企业举例,我们曾经拿出了⼀个多⽉的时间,带领团队成⽴了⼀个调研⼩组,联系了⼆⼗多家各⾏各业的⼯业企业,包含流程制造、离散制造、能源电⼒等等细分⾏业的企业,⽽且规模上有⼤有⼩,地域分布上也覆盖多个省市地区。我记得当时整理了⼀个问题清单,⼏⼗个问题,就是到⼯⼚到⻋间,去⽼师傅的调度室、计划员的计划中⼼,向他们请教,实地⾛访调研,最极限的时候,⾃⼰⼀天就出现在了四个省份。


这样深⼊的调研让我们发现了两个重要且迫切的需求,⼀是如何通过更加精细的计划和调度,来帮助企业更好地管理每天都在发⽣的运营决策问题,降本增效,节能减排;⼆是在⾯对⼤规模复杂问题时的计算效率,怎样才能⼤幅度地提升。⽽对这两个需求的回应,也成了杉数发展到今天,为数百家中国企业提供决策优化服务和求解计算引擎的两块核⼼基⽯。


举个例⼦, 我们服务过的⼀家通讯电⼦的⾏业巨头,它有上百个⼯⼚、上千个⻋间,⼏⼗万种零部件和半成品,想要每天都统筹安排每条产线上何时、应该⽣产哪些产品、⽣产多少,⽽且既保证订单及时交付,⼜遵循⼯艺、产能、环保、出⼝等⼤量的约束和要求,这不仅是⼈脑⽆法处理的问题,甚⾄连计算机⾯对这种上亿规模复杂度的优化问题时,往往也需要⼤量的⼈⼯⼲预,反⽽还会严重影响⽣产效率。


所以我们⼀起构建了⼀套软件系统,不仅能通过计算给出⽣产线的加⼯指令,还能给出每个订单的承诺交付时间,甚⾄还能对异常情况做出预警和分析。更重要的是,⼈⼯⼲预的⽐例下降 70%,还同时带来了接近 20 个百分点的订单满⾜率的提升, 每年的直接经济收益达到数亿元⼈⺠币。⽽这⾥的核⼼,就是精密的决策优化模型,以及⾼效的求解计算⼯具。


⼋年的时间,我们已经成功服务了⼆⼗多个细分⾏业、数百家中国的头部领军企业,从消费品到零售业,从物流到制造业,但这背后,⼀定是⽆数次地蹲⼯⼚、跟物流、趴仓库、看采购,才能慢慢理解那些所谓的 “落地场景”,对于企业来说究竟意味着什么。


在这个实践过程中,我明⽩了数字技术的核⼼价值要从产业服务中来,也从⼀名数字技术的应⽤者,成⻓为了产业服务的实践者。


第三个故事,2021 年。那时的我,正在思考数字技术价值的第三个灵魂拷问:它要到哪⾥去。


之所以要思考,是因为在⼀次闲谈中,⼀位企业家曾经问了我这样⼀个问题:王曦,你们的产业服务做得很好,但如果我的企业没有遇到你,⾃⼰也不是数学专业出⾝,那要怎样才能享受到数据科学的能量呢?


这个问题让我意识到,尽管我明⽩了数字技术的价值是指导决策,也在产业服务中做了⼤量实践,但还有⼀个很重要的问题没有解决,那就是 “打破围城”的问题。对⼤多数⼈来说,数据科学是抽象⽽有⻔槛的,商业问题更是复杂⽽充满变化的。就像钱钟书先⽣在《围城》⾥说 “城外的⼈想进去,城⾥的⼈想出来”⼀样,数字技术也好像⼀座围城,没掌握它的⼈们觉得它复杂、抽象、甚⾄颇有些⻔槛,他们既希望能够找到⾼端的数据技术来解决问题,但也更容易被不科学的数据结果误导和伤害。


所以我们需要的,不是数字技术的理论讲解,⽽需要思维⽅式的⼴泛普及;我们需要架起⼀座连接数据科学与商业问题的新桥梁,而这座桥,我称之为,数据思维


⽽这,不仅让我开始了从产业服务的实践者到数据思维的传播者的⼜⼀次升级,也让我想明⽩了这第三个问题:数字技术的价值,从产业服务中来,更要到思维方式中去。


为此,我开始应邀在学术讲座、⾏业会议上进⾏分享和交流,也加⼊了互联⽹科普⼤军,甚⾄, 我还写了⼀本,关于数据思维的书。我希望它成为 ⼀本不讲公式、 没有代码、⽤⼈类语⾔书写的 “科普读物”,每⼀位对商业问题感兴趣的读者,⽆需数理科班出⾝,也不必钻研公式算法,都应该能够平等地享受到数据科学带来的能量。


我也希望它能成为,⼀本数据思维⽅式的 “鉴赏指南”。改变思维模式同样是⼀种升级,⽽数据思维,更是⼀种⽣产⼒,它能帮我们看清数字⼯具的边界,破除那可恶⼜毫⽆意义的神秘感。


这,就是我想和你分享的三个故事。作为⼀个数字技术从业者,我相信有数⽅能有术,但想要⽤数字技术改变世界,也同样需要我们遵从规律,认清边界。就像这三个故事告诉我们的,数字技术的核⼼价值,在于指导决策,它要从产业服务中来,更要到思维⽅式中去。伴随着对这三个问题的思考和实践,我⾃⼰也从数字技术的应⽤者,转变为产业服务的实践者,再升级为数据思维的传播者,深感荣幸。


也欢迎你和我⼀起踏上这段数据思维之旅。在这个数据驱动的时代下、在这⽚数字经济建设如⽕如荼的⼟地上,这是属于我们的历史机遇,我们也正在⼀起,创造未来。


内容推荐

AI 大模型风起云涌,企业管理者每天都身处复杂的商业决策之中。但仅有数据这把“生产资料”和 AI 大模型这台“生产力工具”,并不意味着价值就能自动兑现。


真正能跨越数据技术与商业问题鸿沟的,是数据思维。基于数百家企业的数字化转型服务经验,我们精心打磨了《玩转 AI 大模型时代的数据思维》课程,帮助你在技术与业务的交汇处,收获更具前瞻性与实践价值的洞察。


2025-01-23 16:325615

评论

发布
暂无评论

第八周总结

《Java程序员修炼之道》.pdf

田维常

京东11.11完美收官!京东智联云以技术服务助力实体经济

京东科技开发者

云计算 大数据 云安全

线程池 ThreadPoolExecutor 原理及源码笔记

程序员小航

Java 源码 jdk 线程池 并发

决策树算法-实战篇

比伯

Java 大数据 编程 架构 算法

面试重灾区——Synchronized深度解析

执墨

并发编程 synchronized 内存布局 CAS 锁升级

架构师训练营第 1 期第 8 周作业

owl

极客大学架构师训练营

分布式集群如何实现高效的数据分布

vivo互联网技术

分布式 DHT hash 数据存储

数字信封加密

笑春风

重大活动网络攻击面前,京东智联云的攻防之道

京东科技开发者

云计算 网络安全 云安全

接口测试文件上传(python+requests)

测试人生路

Python 接口测试

高性能IO模型:为什么单线程Redis能那么快?

小Q

Java redis 学习 架构 面试

SpringBoot中的响应式web应用

程序那些事

spring WebFlux 程序那些事 响应式系统 spring 5

直播预告 | 云原生在CloudQuery中的应用与实践

BinTools图尔兹

数据库 sql 容器 云原生 工具软件

HTTP 前世今生

coolion

大前端 HTTP

springboot+java+redis 简单实用的搜索栏热搜,个人历史记录,文字过滤

灰尘子

详解快速开发平台与工作流通用组件的设计规范

Philips

敏捷开发 快速开发 企业应用

将减少阻力的香蕉法则,运用在软件开发上会产生什么效果?

Philips

敏捷开发 快速开发 企业应用

熔断原理与实现Golang版

万俊峰Kevin

microservice Go 语言

【涂鸦物联网足迹】涂鸦云平台数据类型和取值约束说明

IoT云工坊

人工智能 云计算 物联网 云平台 数据类型

第八周作业

极客大学 - 架构师训练营 第九周作业

9527

charles的使用方法

Yolanda_trying

不可思议,竟然还有人不会查看GC垃圾回收日志?

田维常

垃圾回收 GC

一个数据中台如何算成功了?

薄荷点点

数据中台

BATJTMD,大厂招聘,都招什么样Java程序员?

小傅哥

Java 互联网 面试 小傅哥 简历

关于mysqldump,这个参数你可能还不知道

Simon

MySQL timestamp

面对大促DevOps怎么做?这里有一份京东11.11 DevOps备战指南

京东科技开发者

云计算 DevOps 运维自动化

数据库建表、SQL、索引规范

Bruce Duan

MySQL sql 建表 规范

手把手教你撸一个能生成抖音风格动图的gif制作平台

徐小夕

Java css3 GitHub 开源 GIF

架构师第一期作业(第8周)

Cheer

作业

从理论到实践,如何用数据在AI时代做出最优决策?_管理/文化_王曦_InfoQ精选文章