11 月 19 - 20 日 Apache Pulsar 社区年度盛会来啦,立即报名! 了解详情
写点什么

你的 GitHub 代码已成功入驻北极圈,至少保存 1000 年

  • 2020-07-18
  • 本文字数:2015 字

    阅读完需:约 7 分钟

你的GitHub代码已成功入驻北极圈,至少保存1000年


近日,GitHub 在官方博客上宣布,代码永久保存计划顺利完成,首批开源项目的代码已经于 7 月 8 日正式保存到 the Arctic Code Vault。


在去年 11 月举行的 GitHub Universe 2019 上,GitHub 宣布了一项代码永久保存计划——GitHub Archive Program,通过不间断的跨各种数据格式和位置存储多个副本的方式来保护开源软件代码,至少保存 1000 年。


代码永久保存计划

开源软件的出现为科技发展提供了动力,这也是全人类的共同遗产。GitHub Archive Program 的任务就是最大可能为后代保留这些开源软件。


为了完成这项计划,GitHub 与 the Internet Archive、Microsoft Research 和 Stanford Libraries 等组织机构合作,通过不间断地跨各种数据格式和位置存储多个副本来保护代码,维持至少 1000 年的长期存档。


GitHub 表示,尽管发生全球性灾难的可能性很小,但所有存储在现代设备平台上的内容都可能会在几代后消失,跨多个组织和存储形式的归档软件将有助于确保其长期保存:在线归档员将其称为“ LOCKSS”,因为大量副本可以确保安全。


目前,大量的知识存储在临时媒体设备上:硬盘、SSD、CD 可以使用数十年,备份磁带名义上只有 30 年的寿命,还得严格控制热量和湿度。即便未来这些硬件还在,但运行在上面的软件可能早已被淘汰, GitHub Archive Program 计划有更长远的打算,以解决数据在未来丢失的风险。


与此同时,这一计划也为受到访问限制的开发者提供了选择,如果 GitHub 在某些地方不可用,受影响的开发人员可以使用 Internet Archive 和 Software Heritage Foundation 访问其项目的公共代码。


全球开源代码的北极之旅

2020 年 2 月 2 日,GitHub 会对每个活跃的公共存储库进行快照捕获,并保存在 GitHub Arctic Code Vault 中。在过去几个月中,GitHub 的合作伙伴 Piql 公司将 21TB 大小的存储库数据写入到胶片卷轴上。



据了解,存储所使用的胶片卷轴长达 3500 英尺,由专门负责研发超长期数据保存技术的挪威 Piql 公司提供并编码,其中的薄膜使用卤化银聚酯技术。根据 ISO 标准,这种介质的使用寿命长达 500 年;同时,老化模拟测试表明,其使用时长也能达到原来的两倍。


GitHub 的最初计划是,团队飞往挪威,成员护送全球的开源代码到 the Arctic(北极圈)。但是,随着今年以来新型冠状病毒的全球大流行,GitHub 只能调整计划。一方面与合作伙伴保持紧密联系,另一方面等待安全时刻启航,飞往斯瓦尔巴群岛。


最初,这些代码位于 Piql 公司在挪威德拉门的工厂,装有 186 个胶片卷轴的箱子会从这个工厂被运输到奥斯陆机场,然后“搭乘”飞机,飞往斯瓦尔巴群岛。




据悉,斯瓦尔巴群岛受国际《斯瓦尔巴群岛条约》的管制,属于非军事区,是世界上最北端的城镇所在地,地球上最偏远和地缘政治最稳定的人类居住地之一。AWA 是挪威国有采矿公司 Store Norske Spitsbergen Kulkompani(SNSK)与长期数字存储提供商 Piql AS 的一项联合计划。AWA 致力于永久保存档案,胶片卷轴将被存储在位于斯瓦尔巴群岛偏远群岛一座废弃煤矿密封室内的钢壁容器中。


从奥斯陆机场出发,这些代码会抵达挪威朗伊尔城,这是一个位于斯瓦尔巴群岛且人口很少的城镇。抵达朗伊尔城后,当地的物流公司将这些箱子运走,放到一个安全的仓储中。



第二天早上,它就到达目的地。这是位于北极世界档案馆(AWA)中的数据存储库,位于北极山永久冻土区深 250 米。该档案馆位于斯瓦尔巴群岛的一个废弃煤矿中,比北极圈更靠近北极。



Arctic Code Vault 徽章

现在,存储在 Arctic Code Vault 的开源软件,背后离不开全球成千上万开发者的贡献。为表彰和庆祝开发者所做的贡献,GitHub 还设计了 Arctic Code Vault 徽章,这个徽章会显示 GitHub 上开发者资料的亮点。并且,鼠标悬停在这上面,你还会发现个人贡献的一些存储库。



未来如何获取这些代码?

GitHub 正在召集 GitHub Archive Program 咨询小组,其中包括人类学、考古学、历史学、语言学、档案科学、未来主义等方面的专家,就应该在归档中包含哪些内容以及如何与继承者进行最佳沟通提出建议。存档的简介将包括 QR 解码、文件格式、字符编码和其他关键元数据的技术指南,以便可以将原始数据转换回源代码,以供将来其他人使用。


据悉,该归档文件还将包括技术树(Tech Tree),“技术树”将作为软件开发和计算的快速入门手册,并与该存档的用户指南捆绑在一起。它将描述如何从原始数据向后处理到源代码,以及如何提取项目的目录、文件和数据格式。


受《长期文明手册》启发,该档案还将包括应用开源的信息和指南,以及当下开发者使用开源的情况,以防将来读者需要从头开始重建技术。在人类拥有可以运行的现代计算机但没有可在其上运行的软件的范围内,档案及其技术树可能会非常有价值。但是,该价值很有可能是历史性的。


1000 年前,中国还处于北宋,美国还是蛮荒,全球还未联通。而现在,我们正处于一个全球化、信息化的时代,软件和代码成为社会运转的基础之一。1000 年后,即使开发者已不再,代码也能永久流传。这无疑是人类的一大庆幸!


2020-07-18 21:542691
用户头像
万佳 InfoQ编辑

发布了 673 篇内容, 共 288.5 次阅读, 收获喜欢 1745 次。

关注

评论

发布
暂无评论
发现更多内容

office 2016连接mysql并执行复杂查询

阿呆

MySQL Office

阻塞与非阻塞客户端

Xiao8

微服务 6月月更

通过DAO的现状,看Web3最具影响力的基础设施M-DAO

威廉META

前后端的爱恨情仇

Liam

前端 后端 Postman 开发工具 swagger

焱融科技加入多家行业协会与产业联盟,加速产业互联生态跃迁

焱融科技

Java—线程池

武师叔

6月月更

企业级Web应用系统权限设计

得大自在

权限 权限架构 权限设计

【堡垒机】常见的堡垒机部署模式有哪些?

行云管家

等保 堡垒机 等保2.0

JDBC连接MySQL数据库,访问数据库信息完成登录功能——保姆级详细教程(附所有java和jsp源代码)

写代码两年半

数据库 JDBC Java EE 6月月更

30倍加速,3毫秒极速识别,人、车、OCR等9大识别任务一网打尽

百度开发者中心

不会乘法表怎么做乘法?这个远古的算法竟然可以!

博文视点Broadview

ABAP 程序间传递数据

桥下本有油菜花

研发效能管理如何建立闭环?

思码逸研发效能

研发效能

大数据相关名称解释看这里!简单通俗理解大数据!

行云管家

云计算 大数据 数据安全

ABAP BDC的执行模式和更新模式

桥下本有油菜花

abap

通过DAO的现状,看Web3最具影响力的基础设施M-DAO

鳄鱼视界

对抗软件复杂度的战争

阿里技术

软件架构 复杂度

如何使用物联网低代码平台进行事件管理?

AIRIOT

物联网 低代码开发

飞腾与百度发布云智一体机,金融领域AI场景成功落地“江苏银行”

百度开发者中心

化工产业业态数字升级案例,看摩贝如何快速打通全场景互融互通?

数商云

数字化转型 企业数字化

集成测试时 MockMvc 无法注入

程序员小航

Java 后端 单元测试

盲盒APP开发:如何抓住消费者的心?

WDL22119

盲盒商城 盲盒APP开发 盲盒源码 盲盒H5开发 盲盒小程序

web前端培训JS 运行机制的梳理

@零度

JavaScript 前端开发

易观分析《机器学习平台市场研究,2022》研究报告正式启动

易观分析

机器学习 AI软件

在线办公时代,企业如何选择一款合适的文档管理系统

小炮

敏捷需求管理篇|如何从0-1写好一个用户故事

云智慧AIOps社区

需求管理 编程效率 用户故事 敏捷管理 需求迭代

经期管理APP的开发解决方案

开源直播系统源码

软件开发

Windows域提权漏洞分析与复现

网络安全学海

网络安全 安全 渗透测试 WEB安全 漏洞挖掘

华为云云原生2.0全景图再升级,一切皆服务共创新价值

Geek_2d6073

【大厂面试题精选】UDP 和 TCP 核心知识总结

C++后台开发

面试题 udp TCP/IP 校招 大厂面经

中国信通院、清华大学、腾讯安全,云原生安全产学研用强强联合!

腾讯安全云鼎实验室

云原生 云原生安全

你的GitHub代码已成功入驻北极圈,至少保存1000年_语言 & 开发_万佳_InfoQ精选文章