在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

自动化也要人性化:让复杂系统更加可预测和可靠

  • 2014-11-05
  • 本文字数:1103 字

    阅读完需:约 4 分钟

软件开发者 Brian Troutwine DevOps Days 上分享了有关复杂系统和实时系统的话题,内容涉及到人与机器的交互。Brian 举例说明了哪些是正确的自动化,哪些是不正确的自动化。

实时系统并不仅仅是快速运行的系统,而且是有时间期限的系统。实时系统可分为如下几类:

  • 软类型(soft),即过期后收益递减
  • 固类型(firm),即可容忍偶尔的过期,只是会影响整体系统的服务质量(QoS)
  • 硬类型(hard),即任何过期都会导致整个系统不可用

复杂系统则通常带有如下特征:

  • 非线性反馈
  • 与外部系统耦合
  • 难以建模,难以理解

Brian 用两个例子介绍了关于人类跟机器关系的两种解读:阿波罗 13 号事件中的人类与机器协作,以及切尔诺贝利核事故中的人类与机器的对抗。

在宇宙飞船的项目中,NASA 总是不确定要如何把人类安插到系统当中。有些实验构建了完全自动化的飞船,软件的设计思路完全来自于工程师。宇航员则不觉得这是个好主意,因为他们都是经验丰富的飞行员,在他们看来,宇宙飞船也无非就是更高级的飞机而已,应该由人类来操作,计算机作为辅助系统,人和机器之间达到一种平衡的状态。在阿波罗 13 号事件当中,正是经验丰富的宇航员找到了问题的关键,改造系统以适应他们的需求,才最终解救了自己。

工具在上述事件中的作用是:

  • 正确的自动化减少了重复性劳动
  • 正确的自动化减少了错误
  • 正确的自动化解放人类

而在第二个例子当中,切尔诺贝利核电站的系统被设计成了正反馈系统,即一旦有错误发生,错误会叠加反馈给系统自身,最终造成灾难。在一次后备系统的测试过程中,反应堆进入了容易发生错误的临界状态。由于系统设计和管理上的缺陷,警告信息被忽略,而操作员则进行了误操作;另一方面,反应堆的安全系统当时处于关闭状态。在这种人类不受信任的环境当中,反应堆最终出了故障。这是一个系统处于主导地位,最终导致人类死亡、流离失所。

  • 错误的自动化把人类机器化了。系统不给人类提供信息。
  • 错误的自动化提供错误的指引,提供错误的信息。
  • 错误的自动化使人陷入困境。

每个系统都潜藏着毁灭自己的种子。“正常的意外”总是不可避免,因此故障必然会发生。每个系统的设计都要将故障纳入考虑,否则系统故障将会以想象不到的方式发生。

在设计一个复杂系统的时候,需要认识到人类的局限性并以自动化补充这部分局限性。这个工作不能自己闷头做,需要跟人沟通,集思广益:

  • 用资源交换你需要的东西。
  • 接受故障,从故障中学习。
  • 从他人的事故中学习。
  • 那些一旦故障就造成大损失的组件,可能不值得去做。
  • 理解你构建的东西。

本次分享来自 DevOps Days 第二天的内容第一天的内容可在InfoQ 英文站上查看。

查看英文原文: Automation with humans in mind: making complex systems predictable, reliable and humane

2014-11-05 07:542098

评论

发布
暂无评论
发现更多内容

内网聊天工具私有化IM选择指南,BeeWorks可能适合你

BeeWorks

即时通讯 IM 私有化部署

大数据-73 Kafka 事务与幂等性详解:配置、原理与实战案例全解析

武子康

Java 大数据 kafka 分布式 消息队列

当你的库房物料损耗难管控时,真该看看这家企业怎么做到「零异常流失」

斯科信息

智能称重系统 斯科信息 RFID技术

聚焦制造业智能化转型 中国科学技术大学依托昇腾突破知识增强大模型关键技术

极客天地

实战揭秘|魔搭社区 + 阿里云边缘云 ENS,快速部署大模型的落地实践

阿里云CloudImagine

云计算 边缘计算 大模型 ens 大模型落地

Word可以转PPT吗,如何进行?4个AI工具大盘点

职场工具箱

人工智能 PPT 办公软件 AIGC AI生成PPT

采购议标关键指标:如何评估业务系统的低代码能力?

星云低代码中间件

低代码 数字化转型 企业应用 招投标

云电脑 vs 传统PC:ToDesk、青椒云等3A游戏与AI训练的成本与性能对比

鸽芷咕

人工智能 AI 云电脑 AIGC ToDesk

如何通过Python SDK描述Collection

DashVector

人工智能 数据库 向量检索 大模型 向量检索数据库

构建全面 GRC 策略的三大关键能力|ADManager Plus 助您实现合规与安全并重

运维有小邓

Discord x Pulsar: 使用Pulsar、Flink和Iceburg搭建流式机器学习平台

AscentStream

机器学习 flink pulsar Discord

即时通讯|BeeWorks企业im系统,生态互连重塑企业协同办公

BeeWorks

即时通讯 IM 私有化部署

开发者空间FastGPT问答系统实战:知识库检索 x 联网搜索

华为云开发者联盟

AI 框架 FastGPT 华为开发者空间

小度 X Atwell筑格酒店,共创高端智能化酒店新体验

科技大数据

mybatis中<if>条件判断带数字的字符串失效问题

刘大猫

人工智能 算法 智慧城市 智慧交通 大模型

哈尔滨等保测评:不同行业系统的测评重点差异

等保测评

苏州八大机房20A机柜租用价格范围?应用场景及成功案例分享

苏州服务器托管

苏州服务器托管 苏州机柜租用 IDC机房托管

Apache Doris 在菜鸟的大规模湖仓业务场景落地实践

SelectDB

数据仓库 数据分析 LakeHouse 湖仓一体 菜鸟

Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍

SelectDB

实时数仓 Apaache Doris LLM 数据库 大数据 AI 函数

快手发布Klear-Reasoner:90.5%准确率登顶8B模型榜首,GPPO算法破解RL训练裁剪难题

快手技术

高校数字化转型实战:破解数据孤岛、构建智能指标体系与AI落地路径

袋鼠云数栈

解决方案 智慧校园 高校 智慧校园解决方案 数字化转型‘’

龙蜥社区第 35 次运营委员会会议圆满结束

OpenAnolis小助手

操作系统 龙蜥社区 OpenAnolis

哈尔滨等保测评价格构成与影响因素解析

等保测评

PAIFuser:面向图像视频的训练推理加速框架

阿里云大数据AI技术

AI 视频生成 PAI

从编码工到低代码架构师的新生路

秃头小帅oi

SEO第二十章 产品经理也需要理解SEO

溪抱鱼

html SEO

备受关注的“操作系统开源与 AI 进化”分论坛来了 | 2025 云栖大会

OpenAnolis小助手

操作系统 云栖大会 龙蜥社区 OpenAnolis

LLM 中 token 简介与 bert 实操解读

地平线开发者

自动驾驶 算法工具链 地平线征程6

把数据分析主导权交给业务,Aloudata Agent 面向全行业公开体验

Aloudata

数据分析 agent 指标平台 ChatBI

诺亚ARK 最新CIO报告:科技型通缩正重塑资产配置

财见

自动化也要人性化:让复杂系统更加可预测和可靠_DevOps & 平台工程_Carlos Sanchez_InfoQ精选文章