腾讯亿级用户规模自研业务的上云实践解读,立即报名 了解详情
写点什么

《财富》千强企业技术栈使用状况调查

  • 2020-11-28
  • 本文字数:3948 字

    阅读完需:约 13 分钟

《财富》千强企业技术栈使用状况调查
我们可以使用互联网安全侦查技术来探索财富千强企业的技术栈使用状况。


我们可以通过查看一家公司主要网站的技术栈、互联网电子邮件网关服务以及公司主要域使用的外部名称服务器,来探索这家公司使用的 IT 基础架构。http、smtp 和 dns 服务器都需要托管在某个地方。它们可能在公司自己的 IP 空间内,也可能由第三方云计算公司管理。

 


微软(Azure)、亚马逊(AWS)和谷歌(GCP)主导的云计算市场仍在快速发展当中。《财富》千强企业都选择了哪家云计算巨头呢


当然,这一列表中的许多公司都规模庞大,年收入数以十亿美元计,拥有众多分支、部门和数以千计的员工。即使在同一家公司内部,技术选择也会有很大差异。但即便从这种局限性的视角来看,我们仍然可以管中窥豹,揭示出一些引人入胜的见解。哪些价值数十亿美元的公司正在运行 WordPress、已被淘汰的 Windows 系统或不受支持的 PHP 版本呢?


最小的网站


在我们的分析过程中出现了一个特例。《财富》千强中最轻,可能还是最安全的网站——伯克希尔·哈撒韦(Berkshire Hathaway)正在运行一个完全没有 CSS 的纯 HTML 网站!


这些家伙将干净扁平的设计理念提升到了一个新的高度,他们的风格从 1990 年代开始就没有改变(已通过 Wayback Machine 确认)。我想他们的心思都用来赚取高达 814 亿美元的年利润了,没空费时间做一个华丽的网站出来吧?



关于《财富》千强企业


《财富》千强是由《财富》杂志在美国评选出的千家最大公司组成的。名单上有很多知名品牌和其他鲜为人知的公司。通过使用 Wappalyzer 和开源信息,我们描绘出了支持这些公司互联网业务的技术图景。通过检查这些公司使用的外围技术,我们还可以探索出可能用于公司内部的信息技术。


Web 前端服务(CDN)


不出所料,相当一部分《财富》千强企业正在自己的主要 Web 服务器前使用全球内容交付网络。Akamai 遥遥领先,其次是 CloudFlare。这些服务提供了内容的全球快速交付能力、Web 安全性和拒绝服务保护。



在著名的 CDN 服务中,我们看到亚马逊和微软在 Web 前端中占有重要地位。这些数据点既包括直接托管在云网络中的服务器,又包括亚马逊(CloudFront)和微软 Azure(CDN)提供的内容交付前端服务。


Web 服务器


《财富》千强中最流行的 Web 服务器名单完全不出所料。前三名分别是 ApacheNginx 微软 IIS。由于 CDN 提供商隐藏了 Web 服务器,因此这些 Web 服务器的实际数量可能会更多。许多 CDN 提供商不提供 Server: HTTP 标头,因此这些站点的结果中没有数据。



一个有趣的(尽管并非意外)发现是微软 IIS 的比例很高。与排名前 100 万的网站中的 IIS 采用率相比,《财富》千强网站中的比例要高得多。传统上,许多公司都拥有由微软技术提供支持的公司 IT 系统,因此技术上更偏爱使用微软产品。


服务端技术


对比 Web 服务器上的 Java、ASP.NET 和 PHP 使用情况。



与前面提到的比例更高的微软 IIS 类似,我们还看到了更高比例的 Java 和 ASP.NET。开发人员和技术人员往往在大型企业中使用这些技术,因此我们自然会看到更高的数字。


微软 IIS 和寿命终止软件



通过抓取《财富》千强网站的 HTTP 标头,我们获取了公司正在使用的微软 IIS Web 服务器的版本号。从这些信息中,我们可以推断出他们正在使用的微软 Windows Server 版本。

 


微软不再支持 Windows Server 2008 Windows Server2008 R2。但是,我们仍然找到了 21 个运行这些操作系统的站点。在大型企业中,管理补丁和软件生命周期是非常困难的工作。对于这 21 家公司来说显然更是如此。请注意,尽管 Windows Server 2008 的生命周期已终止(停止支持),但它确实还会收到微软的重要安全补丁。


寿命终结的 PHP


通过查看《财富》千强网站的标头,我们还可以确认其中 59 个网站使用的 PHP 版本。较新的 PHP 版本和某些 Linux 发行版会隐藏 PHP 版本号,不再显示版本号的 X-Powered-By PHP 标头。



不再支持的版本为红色


我们可以看到某些站点没有运行最新版本的 PHP,并且不会收到安全补丁。针对 PHP 生命周期终止版本的问题,我们进行了另一项研究,研究了前 100 万个站点中 PHP 的状态(https://hackertarget.com/php-end-of-life/)。


Web 服务器和后端技术的数量必须作为一个小样本。在 CDN 提供商后面运行的许多站点也会运行这些 Web 服务器和相关技术。


Web 应用程序和内容管理


Web 应用程序的结果更能代表《财富》千强企业的真实用例,因为 Web 应用程序即使位于 CDN 或反向代理之后,也会泄漏其技术状态。


我们看到了 Adobe Experience Manager 平台的明显上升趋势。它似乎越来越受欢迎,特别是在大公司中更是如此。我们已经观察到许多大型公司最近从 WordPress 或 Drupal 平台转向 Adobe Experience Manager。


Adobe Experience Manager 历史数据:


  • 2020 年 9 月(《财富》千强):130(13%)

  • 2020 年 7 月(top 1M):3130(0.31%)

  • 2017 年 10 月(top1M):1819(0.18%)



WordPress 占有率很大,在《财富》千强中有约 14%的网站使用它。特别是,当我们考虑到其开源背景和缺乏企业技术特性时,这个数字更是来之不易。这个 14%的比例低于在较大样本中观察到的 30%以上的数字。


WordPress 托管


WordPress 托管服务提供商 WP Engine,在我们查看 Web 应用程序采用率时脱颖而出。



在《财富》千强公司中有 42 个客户端(约占 WordPress 安装的 30%)是 WP Engine,它显然表现很好。我们将其与 WordPress.com 背后的公司 Automattic 的托管服务做了对比,后者是为希望托管 WordPress 的公司提供的另一种高端服务。


jQuery 和 Bootstrap

 


当下接触网站技术工作的人们都很熟悉这两种技术。就算我们知道它们有多流行,看到这两种资源的使用量如此之大也是很惊讶的。超过一半的《财富》千强网站使用了 jQuery,bootstrap 则超过 25%


电子邮件托管和网关


前文主要关注这些《财富》千强公司的主要网络业务,而 IT 基础架构则要深入许多。通过查看邮件网关和电子邮件托管状况,我们发现微软基于云的 Office 365 电子邮件服务占据了统治地位,获得了超过一半公司的青睐。


再来看看邮件网关(由 MX 记录标识),结果发现了许多流行的安全提供商。其中包括 Proofpoint(34.5%);其他占有率较大的网关有 MessagelabsFireeyeCloud Mimecast


为了更好地了解 Office365 的使用率,我们使用了一种在评估公司电子邮件时使用的,名为渗透测试者的技巧。即使其中许多公司的 MX records 指向电子邮件网关提供商,也可以将公司名称放在域的前面(onmicrosoft.com)来识别 Office 365 电子邮件用户。因此,如果 Hacker Target Pty Ltd 在 Office 365 上托管电子邮件,我们可能会在 hackertarget.onmicrosoft.com 上拥有有效的 MX 记录,该记录指向典型的 outlook.com 主机名。

 


在上图中我们分离了结果。我们在蓝色表示的网关提供商中发现,客户端在电子邮件网关后面使用 Office 365。这样使用 Office 365 的公司数量达到了 514。由于公司可能对标准的 $company.onmicrosoft.com 做了更改,因此实际数量可能更高。


我们无法识别这些电子邮件网关背后的 GSuite(谷歌商业电子邮件)用户;因此无法确认数字。但显然,初始数字表明微软在高端公司的电子邮件市场保持着领先地位。


DNS(NameServers):是内部管理还是外包?


通过将主域解析为已配置的 NS 服务器,可以了解组织是使用第三方托管外部 DNS,还是在自己的公司 IP 空间中管理 DNS。



大多数组织都选择将托管权交给专家。但是,将近 30%的公司正在管理自己的服务器。


扩大攻击面


到目前为止,我们已经检查了主要网站电子邮件和公司使用的 DNS 网关的情况。为了进一步深入研究,我们可以在主域上执行子域搜索来扩展对公司外部主机的了解。


子域枚举是渗透测试者、漏洞赏金猎人和攻击者在评估组织攻击面时常用的一种侦察技术。


使用开源情报(主要是 DNS 数据集),我们可以对目标正在使用的技术获得更广泛的了解。


ASN 托管的《财富》千强公司


下图显示了在《财富》千强中 ASN 的出现次数。数据通过将发现的子域解析为 IP->ASN 得出。



在图表中,我们可以看到《财富》千强企业中有 732 家在亚马逊云(AWS)中至少具有一项服务。


我们还可以对比《财富》千强中的公司对云的使用情况。亚马逊服务占 73%,位居第一。微软紧随其后,占 35%;谷歌仅占 15%。请注意,这不包括我们从电子邮件网关统计的 Office365 数据。如果考虑到这些因素,微软为财富千强企业中超过 50%的的企业提供了服务。


*SalesForce 数据已包含了 SalesForce 拥有的 EXACT-7 ASN 的数据。


继续往下还有很多东西可以深入研究。可以针对已知主机 IP 地址甚至已知公司网络块来查看服务 banner 或其他开源情报(OSINT)源(例如 Shodan),来做进一步的分析。


托管服务的激增


在《财富》千强公司中,我们发现每家公司平均有 11 个不同的 ASN 所有者。对于公司攻击面而言,安全团队应该有着充分完整的了解才行。


  • 准确的资产登记册(在变更控制流程中有一个项目可以更新登记册)

  • 定期针对攻击面进行漏洞测试

  • 针对公司基础架构执行开源侦查


研究方法


这些网站使用的技术是用我们托管的 Wappalyzer 工具(https://hackertarget.com/whatweb-scan/)收集的。它是一个出色的开源项目(https://github.com/AliasIO/wappalyzer),可以下载在本地运行,也可以用作浏览器插件来检测 Web 技术。它会检查站点的 HTML 和 HTTP 标头,以确定其所使用的技术。


此外,为了收集某些产品版本(PHP 和微软 IIS)的详细信息,我们收集了《财富》千强网站的 HTTP 标头。


邮件和名称服务器使用简单的 bash 脚本和 dig 解析。我们用自己的 ASN 查找工具(https://hackertarget.com/as-ip-lookup/)处理了所得的 IP 地址列表,以识别托管服务器的 netblock 所有者。


在收集了每个公司域的子域之后,我们执行了一个简单的 DNS 查找以获取 IP 地址,然后查询 IP 以获取 ASN,并按公司查找 ASN 的唯一编号。


下载完整列表


收到许多读者的要求后,我们已开放列表供下载(https://static.hackertarget.com/fortune1000-tech-stacks.xlsx)。只需访问列出的公开网站,即可获得本文档中的所有主机信息。


原文链接:https://hackertarget.com/fortune-1000-technology-insights

2020-11-28 11:481024

评论

发布
暂无评论
发现更多内容

架构实战营模块 5 作业

星夜

架构实战营

Jetpack之Room的使用,结合Flow

yechaoa

android flow JetPack 6月月更 Room

初识Hadoop之概念认知篇

王小王-123

hadoop hadoop概念

淘宝数据可视化大屏案例(Hadoop实验)

王小王-123

海量数据 大数据分析 淘宝项目 hadoop实验 hive项目

@Scheduled注解的坑,我替你踩了

慕枫技术笔记

后端 6月月更

阅读Skeleton.css源码,改善睡眠质量(尽管它只有419行代码)

德育处主任

CSS 源码 前端 6月月更 skeleton.css

云技能提升好伙伴,亚马逊云师兄今天正式营业

亚马逊云科技 (Amazon Web Services)

亚马逊云

M1笔记本居家办公的痛点及解决方案 | 社区征文

IT蜗壳-Tango

6月月更 初夏征文

远程沟通高效的自我总结| 社区征文

卢卡多多

初夏征文

HashMap分析-新增

zarmnosaj

6月月更

“微博评论”的高性能高可用计算架构

Pengfei

声网自研传输层协议 AUT 的落地实践丨Dev for Dev 专栏

声网

Dev for Dev 网络传输

穿越过后,她说多元宇宙真的存在

白洞计划

我们如何拿到自己满意的薪资呢?这些套路还是需要掌握的

看山

闲聊

什么是IGMP?IGMP与ICMP有啥区别?

wljslmz

网络协议 6月月更 IGMP 组播

【值得收藏】HTML5使用多种方法实现移动页面自适应手机屏幕的方法总结

迷彩

前端 自适应 HTML5, CSS3 6月月更

淘宝大数据分析案例(百万数据集Hadoop项目)

王小王-123

大数据分析 淘宝大数据 淘宝业务数据 淘宝项目可视化

Serverless 在阿里云函数计算中的实践

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

架构实战营模块 5 作业

Roy

架构实战营

在Hadoop环境里面统计西游记文章的词组(hdfs实验)

王小王-123

mapreduce hadoop统计词频 hadoop项目 文本统计分析

Flutter 中的 ValueNotifier 和 ValueListenableBuilder

坚果

flutter dart 6月月更

基于Hadoop豆瓣电影数据分析(代码+原理)

王小王-123

大数据 数据分析 基于Hadoop豆瓣电影

[译]在软件开发行业工作 6 年后,那些年我曾改过的观念

宇宙之一粟

感悟 6月月更

架构实战营模块5作业

挖了蘑菇哩斯

架构实战营

小心transmittable-thread-local的这个坑

看山

Java’

利用Docker极速下载OpenJDK11源码

程序员欣宸

Docker Openjdk 6月月更

微博系统中”微博评论“的高性能高可用计算架构

Geek_e8bfe4

基于学生选课数据库分析(Hadoop实验)

王小王-123

hadoop 大数据分析 学生选课项目 数据库项目

传统微服务框架如何无缝过渡到服务网格 ASM

阿里巴巴云原生

阿里云 微服务 云原生 Service Mesh 服务网格 服务网格

Dart 开发技巧

Geek_0a3437

flutter android dart 6月月更

Seata 与三大平台携手编程之夏,百万奖金等你来拿

阿里巴巴云原生

阿里云 开源 云原生 seata

《财富》千强企业技术栈使用状况调查_架构_Hacker Target_InfoQ精选文章