“AI 技术+人才”如何成为企业增长新引擎?戳此了解>>> 了解详情
写点什么

使用基因组学研究和云计算拯救考拉

  • 2019-10-17
  • 本文字数:1499 字

    阅读完需:约 5 分钟

使用基因组学研究和云计算拯救考拉

9 月 28 日是拯救考拉日,借此良机我要向大家介绍借助 AWS Research Credits 和 AWS 云实现的一些值得注意的创新研究。


五年前,一个由 Rebecca Johnson 博士澳洲博物馆研究所主任)领导的团队建立了一项旨在更好地了解考拉种群、遗传学和疾病的研究。作为一种在生物学上独一无二的动物,由于其食欲受限,保持健康且基因多样化的种群对任何保护计划来说都是关键的因素。除了总结考拉的遗传学多样化特征,该团队还希望增强澳大利亚领导大规模基因组测序项目的能力。


考拉基因组内部


上个月,该团队在 Nature Genetics(《自然-遗传学》)上发表了他们的成果。他们的论文 (Adaptation and Conservation Insights from the Koala Genome) 确定了考拉生物学独特性的基因组学基础。虽然我在阅读这篇论文时不得不查找很多概念,但是阅读后我仍然能很好地了解他们的发现。下面是我列出的文章提要:


有毒食物 – 考拉喜食的桉树叶含有多种其他物种进食后会产生毒性的物质。具有去毒功能的基因编码酶中的基因扩增和选择事件让考拉能够迅速将这些物质解毒,使它们能够依赖没有任何其他动物喜食的食物维持生命。代谢加速背后的所有遗传学特点还导致普通抗炎药和抗生素对于患病的考拉失去疗效。


食物选择 – 早先我曾提到,考拉对食物极其挑剔。从遗传学上来说,这可能是因为它们的嗅觉和味觉得到增强,有 6 种基因让它们能够根据气味分辨出植物代谢物。研究人员还发现,考拉体内有一种基因能够帮助它们选择高含水量的桉树叶,另一种基因可增强他们对苦味和鲜味的感知能力。


繁殖 – 确定了控制排卵和分娩的具体基因。雌考拉仅在需要时产生卵子,表现得非常节约。


考拉母乳 – 新出生的考拉体形只有菜豆大小,体重不足半克! 它们经过大约半年哺育,以成分随时间发生变化的母乳为食,这可能存在遗传学相关性。研究人员还发现了一些已知其具有抗菌剂功能的基因。


免疫系统 – 研究人员确定了一些基因,它们构成了考拉对其受影响的某些疾病具有抵抗性、免疫性或易感性的基础。他们还发现了“基因组侵袭”(他们的说法)的证明,确认考拉逆转录病毒确实插入了基因组。


遗传学多样化 – 研究人员还检查了地质学事件,例如栖息地屏障和地面温度如何塑造遗传学多样化和种群进化。他们发现,来自不同区域的考拉在遗传学多样化方面存在显著差异,有证据表明这种多样化(或缺乏多样化)与自然屏障(例如,Hunter Valley)有关。


AWS 提供支持


产生完整的基因序列需要惊人的计算能力和海量存储(以及许多其他要求)。


虽然我不未完全了解此流程,但是我知道它自下而上的工作原理。DNA 样本分成可管理的小份,每一份都包含数万个碱基对。使用各种化学物质产生不同的碱基组成(A、T、C 或 G)使其发出荧光,然后捕获、测量并存储形成的发射数据。由于此研究生成了考拉参考基因组,因此使用在 AWS 上运行的名为 Falcon 的重叠布局共同序列算法组合测序读取数据。考拉基因组在 34.2 亿个碱基对后出现,比人类基因组略高。


我很高兴在报告,这项突破性工作是在 AWS 上进行的。研究团队使用 cfnCluster 形成了多个簇,各包含 500 到 1000 vCPU,从 Pacific Biosciences 上运行 Falcon。总的来说,该团队使用 300 万 EC2 核小时,其中大多数是 EC2 Spot 实例。获得灵活的低成本计算能力后,生物信息学团队能够使用他们换用的 Falcon 管道配置进行实验,并适应其工作负荷。


我们非常高兴,在这项有趣且价值无量的研究中贡献了自己的微薄力量!


作者介绍:


Jeff Barr


AWS 首席布道师; 2004年开始发布博客,此后便笔耕不辍。
复制代码


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/saving-koalas-using-genomics-research-and-cloud-computing/


2019-10-17 09:00700
用户头像

发布了 1825 篇内容, 共 89.6 次阅读, 收获喜欢 73 次。

关注

评论

发布
暂无评论
发现更多内容

【Android Tips】小厂的扫码还能怎么做?

李小四

机器学习 二维码 扫码 微信扫码

不明白线程池?那看看这篇,附10道面试题

田维常

线程池

甲方日常 91

句子

工作 随笔杂谈 日常

【CSS】波纹效果

德育处主任

CSS小技巧 28天写作 纯CSS

十年运维经验总结出的智能运维系统落地方案

小术晓术

人工智能 运维 企业信息化 运维自动化 信息化

【Mysql-InnoDB 系列】幻读、死锁与事务调度

程序员架构进阶

MySQL 架构 innodb 事务 28天写作

前端知识总结输出文章目录大全

梁龙先森

JavaScript 大前端 编程语言 28天写作

Vue 3自定义指令开发

葡萄城技术团队

【CSS】不规则阴影

德育处主任

css3 html/css CSS小技巧 28天写作 纯CSS

Android JNI模板与读取系统属性笔记

Changing Lin

android

try-catch-finally中的4个大坑,不小心就栽进去了!

王磊

Java 异常处理 try finally

为什么这么一道iOS小题目,这么多面试者搞不定?

Geek_24a3d9

面试 技术交流 ios开发

IDEA Malformed argument has embedded quote

会飞的猪

IDEA

即构SDK新增焦点语音功能,可实现特定用户语音的聚焦

ZEGO即构

[高并发]高并发分布式锁架构大解密,不是所有的锁都是分布式锁!!

for

阿里巴巴正式推出2021年金三银四1000道Java工程师面试题手册(含答案)

Java架构追梦

Java 阿里巴巴 面试 架构师 金三银四

安卓驱动开发!系统盘点Android开发者必须掌握的知识点,搞懂这些直接来阿里入职

欢喜学安卓

android 程序员 面试 移动开发

Flink + Iceberg 全场景实时数仓的建设实践

Apache Flink

flink

Maintainer 聚光灯:KubeEdge 和 Volcano 的王泽锋

华为云原生团队

开源 边缘计算 华为云 批量计算

「产品经理训练营」第三章作业

Sòrγy_じò ぴé

产品经理训练营 极客大学产品经理训练营 产品训练营

高阶段位机房管理:3D集装箱数据中心,触发科技“火苗”的燃烧

一只数据鲸鱼

数据可视化 3D可视化 机房管理 数据中心可视化 集装箱式数据中心

android开发面试准备!Android高级工程师进阶学习,已开源

欢喜学安卓

android 程序员 面试 移动开发

个人信息严控的时代,AI如何实现“安全”的智能营销?

星环科技

大数据

百度信息流和搜索业务中的弹性近线计算探索与应用 | 文末送福利

百度Geek说

Java 大前端 算法工程师 技术宅

深扒!用6部分讲完Java性能调优:多线程+设计模式+数据库

996小迁

数据库 JVM 设计模式 多线程 性能调优

程序员必知的几种限流方案

Java架构师迁哥

IntelliJ IDEA 20周岁啦,为期2天的周年庆活动对开发者免费开放

YourBatman

eclipse ide IDEA IntelliJ IDEA

“删库跑路”,这背后的数据安全你悟到了吗?

BinTools图尔兹

数据库 大数据 数据安全 数据库管理工具 删库

Spring Security 实战干货:分布式对象SharedObject

Java spring 分布式

灵雀云Kube-OVN进入CNCF沙箱,成为CNCF首个容器网络项目

York

灵雀云 Kubernetes Kube-OVN

Elasticsearch 批量查询 mget

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

使用基因组学研究和云计算拯救考拉_文化 & 方法_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章