阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

所有有趣的问题都是扩展性方面的问题

  • 2012-05-02
  • 本文字数:1537 字

    阅读完需:约 5 分钟

John Sloan Digital Aggregates Corporation 公司的技术咨询师,他关注超大型和超小型系统,包括分布式,实时、高性能、嵌入式、高度并行系统等多方面。他有一个名为 Chip Overclock 的博客,最近发布了一篇文章——《所有有趣的问题都是扩展性方面的问题》。

John 之前曾在美国国家大气研究中心工作,2006 年时,他绘制了一个图表:

这个图表的横轴是以年为单位的时间,纵轴是技术随时间演变的对数值。John 在 1997 年做了相关的数据挖掘,下面是他的一些假定:

微处理器速度每 2 年翻一倍。

内存密度每 1.5 年翻一倍。

总线速度每 10 年翻一倍。

总线带宽每 5 年翻一倍。

网络连接速度每 1 年翻一倍。

网络带宽每 10 年增加 10 倍。

第二存储密度每 10 年增加 10 倍。

每个微处理器上的 CPU 核每 1.5 年翻一倍。

虽然有些数据已经不再准确了,但是 John 的基本理念没有变:

所有的技术都在变,但是速率不同。这意味着:你之前基于掌握的技术做出了一些技术决策,但是这些决策对于你目前掌握的技术来说可能已经不再正确了。

……

我的经验告诉我:所有有趣的问题都是扩展性方面的问题。这张图展示出了可扩展性的时间因素。

2006 年,John 还展示了一张饼图,列出了软件开发生命周期中的各项成本占比。其中,维护成本占到 67%。也就是说,即使你能消除掉所有初期开发和测试的成本,软件生命周期的成本也只能缩减三分之一。John 还听说:有些要支持上百万行代码的组织认为,67% 还是太低了,有些甚至能达到 80%。

John 提到:

Les Hatton 发现:软件维护可以大概分为三类——修正(修复出问题的代码)、完善(改进某些没有问题的代码,比如提升性能或是降低维护成本)、适应。最后这一类将上述两个图结合在一起。适应性维护是说:因为你不能控制的某些东西发生改变,你必须要改变你的代码。

John 的嵌入式领域工作经验告诉他:他常常碰到适应性维护情况。因为某些厂商常常不再生产某些关键硬件组件,而且没有兼容的可替代品。

而他在企业级服务器端的开发经验也有同样情况。

大量的软件基于商业或开源框架和程序库。你会想要升级到最新版本,因为要修复关键的 bug,或者更新全新特性,因为这会影响你的最终交付时间,可最后却发现:你如此依赖的软件做出了“改进”,提供者调整了它的编程接口!这样的事情就会让产品经理急得像热锅上的蚂蚁。

John 认为,要应对这样的事情,可以从 Arduino 和其 8 位 Atmel megaAVR 微控制器学习。他对比了自己使用的 Mac Mini 和 Freetronics EtherMega 单板,指出:

当我在为 EtherMega 单板编写代码时,我之前编写桌面或者服务器平台的经验,包括如何在时间和空间之间权衡等等,都可以抛出窗外了。举个例子,根据应用情况,如果需要某个值,每次都重新计算可能更好,而不是计算一次然后存储起来,因为在 EtherMega 上,存储字节要远比 CPU 处理周期更为重要。

John 接下来提到:

为嵌入式系统开发软件和为高性能计算或大型分布式平台开发软件,二者需要的技能在很大称度上相同,我不是第一个发现这一点的人。

……

在高性能计算(之前成为超级计算)领域中有个趋势:“重新计算”,而不是“计算然后存储”或者“计算然后传输”。因为纯计算能力的增长要远远超过内存或通讯带宽的增长。为这些微控制器小不点编程,与为大型超级计算机编程,二者之间的相似之处比我们想象的多得多。

给微控制器小不点编写软件,这迫使你严肃对待资源限制,要先考虑时间和空间的权衡,要思考如何向上扩展,更要认真思考如何向下扩展。

最后,John 号召大家都尝试下嵌入式开发:

在我的 Amigo 项目中使用像 Arduino 和 FreeRTOS 这样的技术,让我成为了一个更优秀、更聪明、更能深入思考的软件开发者。我相信你也同样可以从中受益,不管你的问题所在领域及其规模如何。

InfoQ 的读者们,您在自己的项目中是否遇到了类似的问题呢?

2012-05-02 00:212461
用户头像

发布了 479 篇内容, 共 152.4 次阅读, 收获喜欢 47 次。

关注

评论

发布
暂无评论
发现更多内容

新一代容器平台ACK Anywhere,来了

阿里巴巴中间件

阿里云 云原生 中间件 ACK ACK Anywhere

使用 Ansible 部署 Elasticsearch 集群

Se7en

linux之iftop命令

入门小站

Linux

设计微博系统中"微博评论"的高性能高可用计算架构

Rabbit

最长回文子串 -- 三种解答

秦怀杂货店

数据结构 算法 最长回文子串

偷瞄大佬书签栏,16个C++必备学习网站,建议收藏

奔着腾讯去

c++

阿里P8最全总结PDF:Tomcat+虚拟机+Spring全家桶+MyBatis源码等

Java 架构 面试 程序人生 编程语言

强化学习RL AWS 自动驾驶DeepRacer ROS 架构 易筋 ARTS 打卡 Week 71

John(易筋)

ARTS 打卡计划

如何区分封闭图形的内部和外部

Changing Lin

10月月更

接棒运动赛事!工厂里也有热血竞技?

白洞计划

虚拟化管理软件比较(Eucalyptus, OpenNebula, OpenStack, OpenQRM,XenServer, Oracle VM, CloudStack,ConVirt)

hanaper

MyBatis 批量插入数据的 3 种方法!

王磊

Java mybatis springboot

重置不良的编程陋习

devpoint

编码习惯 10月月更

私有分布式账本技术还是公共区块链?

CECBC

【Vuex 源码学习】第九篇 - Vuex 响应式数据和缓存的实现

Brave

源码 vuex 10月月更

[ Golang 中的 DDD 实践] 值对象

baiyutang

golang 设计模式 领域驱动设计 DDD 10月月更

【LeetCode】无重复字符的最长子串Java题解

Albert

算法 LeetCode 10月月更

内网域渗透分析(实战总结)

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

看山聊 Java:检查日期字符串是否合法

看山

Java 10月月更

VNC服务安装配置与使用

耳东@Erdong

vnc 10月月更

用时三个月,阿里P8大佬总结出来的最深《Java性能优化全攻略》限时分享!

Java 架构 面试 程序人生 编程语言

看完阿里大牛的数据结构学习笔记,我直接手撕了500道Leetcode题

Java 程序员 架构 面试 算法

自我提升:高效能人士的 7 个习惯学习笔记(二)

程序员架构进阶

效率 自我管理 自我提升 10月月更

以太坊的黄金时代:模块化的区块链范式的开端

CECBC

都2021年了,还在算法上折跟头?这本《字节跳动面试必问算法秘籍》送给你!

Java 架构 面试 程序人生 编程语言

Serverless 工程实践 | Serverless 应用优化与调试秘诀

阿里巴巴云原生

阿里云 Serverless 云原生

架构实战营模块九作业 - 毕业设计

王晓宇

架构实战营

“区块链+农业”推动产业“提档升级”

CECBC

100台机器上海量IP如何查找出现频率 Top 100?

秦怀杂货店

IP 海量数据 top

还在郁郁寡欢?啃完666页Java面试高频宝典,十月保你定级腾讯T3-2

Java 架构 面试 程序人生 编程语言

在线2-36任意进制转换工具

入门小站

工具

所有有趣的问题都是扩展性方面的问题_架构_郑柯_InfoQ精选文章