9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

使用基因组学研究和云计算拯救考拉

  • 2019-10-17
  • 本文字数:1499 字

    阅读完需:约 5 分钟

使用基因组学研究和云计算拯救考拉

9 月 28 日是拯救考拉日,借此良机我要向大家介绍借助 AWS Research Credits 和 AWS 云实现的一些值得注意的创新研究。


五年前,一个由 Rebecca Johnson 博士澳洲博物馆研究所主任)领导的团队建立了一项旨在更好地了解考拉种群、遗传学和疾病的研究。作为一种在生物学上独一无二的动物,由于其食欲受限,保持健康且基因多样化的种群对任何保护计划来说都是关键的因素。除了总结考拉的遗传学多样化特征,该团队还希望增强澳大利亚领导大规模基因组测序项目的能力。


考拉基因组内部


上个月,该团队在 Nature Genetics(《自然-遗传学》)上发表了他们的成果。他们的论文 (Adaptation and Conservation Insights from the Koala Genome) 确定了考拉生物学独特性的基因组学基础。虽然我在阅读这篇论文时不得不查找很多概念,但是阅读后我仍然能很好地了解他们的发现。下面是我列出的文章提要:


有毒食物 – 考拉喜食的桉树叶含有多种其他物种进食后会产生毒性的物质。具有去毒功能的基因编码酶中的基因扩增和选择事件让考拉能够迅速将这些物质解毒,使它们能够依赖没有任何其他动物喜食的食物维持生命。代谢加速背后的所有遗传学特点还导致普通抗炎药和抗生素对于患病的考拉失去疗效。


食物选择 – 早先我曾提到,考拉对食物极其挑剔。从遗传学上来说,这可能是因为它们的嗅觉和味觉得到增强,有 6 种基因让它们能够根据气味分辨出植物代谢物。研究人员还发现,考拉体内有一种基因能够帮助它们选择高含水量的桉树叶,另一种基因可增强他们对苦味和鲜味的感知能力。


繁殖 – 确定了控制排卵和分娩的具体基因。雌考拉仅在需要时产生卵子,表现得非常节约。


考拉母乳 – 新出生的考拉体形只有菜豆大小,体重不足半克! 它们经过大约半年哺育,以成分随时间发生变化的母乳为食,这可能存在遗传学相关性。研究人员还发现了一些已知其具有抗菌剂功能的基因。


免疫系统 – 研究人员确定了一些基因,它们构成了考拉对其受影响的某些疾病具有抵抗性、免疫性或易感性的基础。他们还发现了“基因组侵袭”(他们的说法)的证明,确认考拉逆转录病毒确实插入了基因组。


遗传学多样化 – 研究人员还检查了地质学事件,例如栖息地屏障和地面温度如何塑造遗传学多样化和种群进化。他们发现,来自不同区域的考拉在遗传学多样化方面存在显著差异,有证据表明这种多样化(或缺乏多样化)与自然屏障(例如,Hunter Valley)有关。


AWS 提供支持


产生完整的基因序列需要惊人的计算能力和海量存储(以及许多其他要求)。


虽然我不未完全了解此流程,但是我知道它自下而上的工作原理。DNA 样本分成可管理的小份,每一份都包含数万个碱基对。使用各种化学物质产生不同的碱基组成(A、T、C 或 G)使其发出荧光,然后捕获、测量并存储形成的发射数据。由于此研究生成了考拉参考基因组,因此使用在 AWS 上运行的名为 Falcon 的重叠布局共同序列算法组合测序读取数据。考拉基因组在 34.2 亿个碱基对后出现,比人类基因组略高。


我很高兴在报告,这项突破性工作是在 AWS 上进行的。研究团队使用 cfnCluster 形成了多个簇,各包含 500 到 1000 vCPU,从 Pacific Biosciences 上运行 Falcon。总的来说,该团队使用 300 万 EC2 核小时,其中大多数是 EC2 Spot 实例。获得灵活的低成本计算能力后,生物信息学团队能够使用他们换用的 Falcon 管道配置进行实验,并适应其工作负荷。


我们非常高兴,在这项有趣且价值无量的研究中贡献了自己的微薄力量!


作者介绍:


Jeff Barr


AWS 首席布道师; 2004年开始发布博客,此后便笔耕不辍。
复制代码


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/saving-koalas-using-genomics-research-and-cloud-computing/


2019-10-17 09:00945
用户头像

发布了 1928 篇内容, 共 155.0 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

python逆序输出和进制转化(小白也能看懂)

写代码两年半

Python 6月月更

Java—JVM

武师叔

6月月更

配置swagger

卢卡多多

swagger 6月月更

Docker 实用技巧二

Nick

Docker 容器 实用技巧 6月月更 实操

从市场需求目标看数据分析演进方向

华为云开发者联盟

人工智能 华为云

力扣每日一练之二维数组下篇Day5

京与旧铺

6月月更

python程序设计思想

左手の明天

Python 面向对象

百度团队CSS编码规范

sean77

2022-06微软漏洞通告

火绒安全

微软 漏洞 安全漏洞

挑战最全 Apache Doris 学习资料,你想要的都在这里了!

SelectDB

数据库 Doris apache doris 技术干货

倒计时1天,龙蜥社区走进Intel MeetUp 即将开播!直播大奖等你来拿

OpenAnolis小助手

开源 intel Meetup 龙蜥社区 线上直播

leetcode 413. Arithmetic Slices 等差数列划分

okokabcd

LeetCode 算法与数据结构

【愚公系列】2022年06月 通用职责分配原则(五)-控制器原则

愚公搬代码

6月月更

GetxController 生命周期详解

岛上码农

flutter ios 前端 安卓 6月月更

考试试卷存储方案

极客土豆

跟着官方文档学 Python 之:3.12 新变化

甜甜的白桃

Python python3.x 6月月更

LabVIEW Arduino无线蓝牙遥控智能车(项目篇—2)

不脱发的程序猿

LabVIEW Arduino VISA 无线遥控智能小车 无线蓝牙遥控智能车

如何设计BI平台

奔向架构师

数据仓库 商业智能 6月月更

关于微服务通信的一些Tips

阿泽🧸

微服务 6月月更

flutter系列之:深入理解布局的基础constraints

程序那些事

flutter 程序那些事 6月月更

GCC 为龙芯 CPU的预定义宏

mazhen

c++ RocksDB GCC 龙芯

数据库每日一题---第15天:未消费的顾客

知心宝贝

数据库 程序员 前端 后端 6月月更

LabVIEW Arduino ZigBee无线气象站(项目篇—3)

不脱发的程序猿

物联网 LabVIEW Arduino ZigBee无线气象站 无线传感器

Android 自定义View之展开收起的Layout

yechaoa

android 自定义view 6月月更

如何往 Kafka 发送大消息?

Se7en

一文带你认识CSS

未见花闻

6月月更

在 Pisa-Proxy 中,如何利用 Rust 实现 MySQL 代理

SphereEx

MySQL 数据库 rust

InfoQ 极客传媒 15 周年庆征文|海王的鱼塘是怎样炼成的

知心宝贝

人工智能 大数据 运维 前端 InfoQ极客传媒15周年庆

5分钟了解红队如何搜索网络情报

穿过生命散发芬芳

6月月更 攻防演练

依图在实时音视频中语音处理的挑战丨RTC Dev Meetup

声网

音视频 RTC Dev Meetup 语音处理

「 2022 精益软件工程大会」圆满闭幕,观测云奉献精彩主题演讲

观测云

使用基因组学研究和云计算拯救考拉_文化 & 方法_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章