【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

浅析 Microsoft DNA 存储

  • 2016-05-04
  • 本文字数:1089 字

    阅读完需:约 4 分钟

Microsoft 正在实验用人工合成 DNA 实现数字化数据存储,并于最近向遗传学初创公司 Twist Bioscience 购买了一千万条 DNA。

据悉 Microsoft 有关 DNA 存储的实验是与华盛顿大学(University of Washington)合作进行的。联合研究团队最近提交了一份描述下图所示完整 DNA 归档存储系统架构述的论文

DNA 存储系统由一个对数据进行编码,以便将数据存储在 DNA 中的 DNA 合成器;一个包含大量“隔间”,将 DNA 的存储池与数据卷进行映射的存储容器;以及负责读取 DNA 序列并将其重新转换为原始数据的 DNA 序列器组成。

DNA 存储技术目前有个非常有趣的问题需要解决:寻址。DNA 链是 DNA 存储的基本单位,DNA 链由大约 100-200 个核苷酸组成,可存储 50–100 比特信息。这意味着一个典型的数据对象需要映射至大量 DNA 链。研究人员目前使用了键 - 值架构,因此这里的关键在于首先需要关联至包含所需链的池,随后通过随机访问机制访问池中的链。

另一个有趣之处在于数据的呈现方式。DNA 由 4 个碱基(A、C、G、T)组成,因此 base-4 是最直接的数据呈现方法,例如 01110001 可通过 base-4 的方式转换为 1301,并映射为 DNA 序列中的 CTAC 结构。然而除此之外,研究人员还选择了一种 base–3 呈现方式,借此可通过一个核苷酸实现纠错。那么在上述的例子中,01100001 可转换为 base-3 格式的 01112,并映射至为 DNA 序列中的 CTCTG 结构。

有关 DNA 存储原理的详细信息,包括如何通过编码改善可靠性,以及目前进行过的几个实验,可参阅上文提及的 PDF 论文。

根据 Twist Bioscience 公司介绍,相对传统数字化存储,基于 DNA 的归档技术可提供两个重要优势:寿命更长,最新研究数据显示 DNA 数据存储的寿命高达 2000 年;并且数据密度更高,一克 DNA 即可存储一兆 GB 数据。

根据 Microsoft 和华盛顿大学研究人员的介绍,DNA 存储并不是闪存或硬盘的替代品:

我们将 DNA 存储视作一种最持久的深层存储体系,可提供高密度且持久的归档存储方案,以及数小时乃至数天的访问时间。

这种想法的重点在于,DNA 的合成和排序可以任意程度的序列化方式进行,因此可以轻松获得所需的读写带宽。

Microsoft 公司 DNA 存储项目主管 Doug Carmean 澄清说,他们使用 Twist 提供的 DNA 进行初步测试“证明了数字化数据可通过这种方式进行编码,并可 100% 还原为原始数据”,但在这种技术正式商用之前还有很多工作有待完成。

作者:Sergio De Simone
阅读英文原文 A Look at Microsoft DNA Storage


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-04 19:001577
用户头像

发布了 283 篇内容, 共 102.2 次阅读, 收获喜欢 61 次。

关注

评论

发布
暂无评论
发现更多内容

【教程】App打包成IPA文件类型的四种方法

倒计时1天 | 袋鼠云春季发布会完整议程出炉!快快预约直播

袋鼠云数栈

AI 指标体系 大模型 指标建设

Linux网络名称空间概述

GousterCloud

Linux Kenel

Linux网络名称空间之独立网络资源管理

GousterCloud

网络 Linux Kenel

CentOS7编译ZooKeeper C客户端

百度搜索:蓝易云

云计算 zookeeper Linux centos 云服务器

你应该知道的21个html小技巧

南城FE

html 前端 代码优化

软件业务模型

执于业务

IP和MAC的作用区别

百度搜索:蓝易云

云计算 Linux Mac IP 云服务器

JSON 迎来的首个大客户竟是那种网站

胡译胡说

JavaScript json

PrismNET即将精彩亮相Token 2049 迪拜峰会,全面拓展国际影响力

PrismNET

比特币 dapp 区块链+ PrismNET棱镜协议 PrismNET

百度获评CCIA数据安全和个人信息保护社会责任评价“三星”示范单位

百度安全

数据安全 隐私合规

Linux网络名称空间和Veth虚拟设备的关系

GousterCloud

业务模型设计方法和实例

执于业务

【PolarDB-X从入门到精通】 第四讲:PolarDB分布式版安装部署(源码编译部署)

阿里云数据库开源

数据库 阿里云 分布式数据库 PolarDB-X

深入理解Linux veth虚拟网络设备:原理、应用与在容器化架构中的重要性

GousterCloud

Linux Kenel 虚拟网卡

嵌入式软件开发应该掌握哪些知识?

智趣匠

嵌入式程序 嵌入式开发 嵌入式系统软件开发

《计算机程序设计艺术(第1卷):基本算法(第3版)》PDF

程序员李木子

ido预售私募官网开发

西安链酷科技

ido私募 预售官网

短剧app软件开发、微短剧爽剧软件开发、

西安链酷科技

短剧app开发 爽剧app开发

百度智能云向量数据库 VectorDB 性能报告

Baidu AICLOUD

向量数据库

It is what it is

EchoZhou

English

华为云耀云服务器X实例:柔性算力新物种,更强更省更智能的云基础设施

平平无奇爱好科技

现成源码与定制开发:拍卖直播商城平台的最佳选择是谁?

软件开发-梦幻运营部

用 AI 让数据分析更智能 - Amazon Q 在 Amazon Quicksight 中的应用

亚马逊云科技 (Amazon Web Services)

数据分析 生成式人工智能

dapp区块链质押挖矿、质押nft项目开发

西安链酷科技

DAPP系统开发

学习 XSLT:XML文档转换的关键

小万哥

xml 程序人生 编程语言 软件工程 前端开发

lvm+raid(逻辑磁盘+阵列)创建删除恢复for linux

百度搜索:蓝易云

云计算 Linux 云服务器 raid lvm

去中心化应用软件开发 dapp质押挖矿系统定制

西安链酷科技

DAPP系统开发 dapp抢单nft

去中心化交易所开发 深入了解各大交易所上币费用

西安链酷科技

币币交易所开发

大揭秘!时习知如何助力华为2024年中国政企合作伙伴商务精英赛?

平平无奇爱好科技

新质生产力,点燃终端厂商的“办公”激情

脑极体

AIPC

浅析Microsoft DNA存储_语言 & 开发_Sergio De Simone_InfoQ精选文章