写点什么

使用基因组学研究和云计算拯救考拉

  • 2019-10-17
  • 本文字数:1499 字

    阅读完需:约 5 分钟

使用基因组学研究和云计算拯救考拉

9 月 28 日是拯救考拉日,借此良机我要向大家介绍借助 AWS Research Credits 和 AWS 云实现的一些值得注意的创新研究。


五年前,一个由 Rebecca Johnson 博士澳洲博物馆研究所主任)领导的团队建立了一项旨在更好地了解考拉种群、遗传学和疾病的研究。作为一种在生物学上独一无二的动物,由于其食欲受限,保持健康且基因多样化的种群对任何保护计划来说都是关键的因素。除了总结考拉的遗传学多样化特征,该团队还希望增强澳大利亚领导大规模基因组测序项目的能力。


考拉基因组内部


上个月,该团队在 Nature Genetics(《自然-遗传学》)上发表了他们的成果。他们的论文 (Adaptation and Conservation Insights from the Koala Genome) 确定了考拉生物学独特性的基因组学基础。虽然我在阅读这篇论文时不得不查找很多概念,但是阅读后我仍然能很好地了解他们的发现。下面是我列出的文章提要:


有毒食物 – 考拉喜食的桉树叶含有多种其他物种进食后会产生毒性的物质。具有去毒功能的基因编码酶中的基因扩增和选择事件让考拉能够迅速将这些物质解毒,使它们能够依赖没有任何其他动物喜食的食物维持生命。代谢加速背后的所有遗传学特点还导致普通抗炎药和抗生素对于患病的考拉失去疗效。


食物选择 – 早先我曾提到,考拉对食物极其挑剔。从遗传学上来说,这可能是因为它们的嗅觉和味觉得到增强,有 6 种基因让它们能够根据气味分辨出植物代谢物。研究人员还发现,考拉体内有一种基因能够帮助它们选择高含水量的桉树叶,另一种基因可增强他们对苦味和鲜味的感知能力。


繁殖 – 确定了控制排卵和分娩的具体基因。雌考拉仅在需要时产生卵子,表现得非常节约。


考拉母乳 – 新出生的考拉体形只有菜豆大小,体重不足半克! 它们经过大约半年哺育,以成分随时间发生变化的母乳为食,这可能存在遗传学相关性。研究人员还发现了一些已知其具有抗菌剂功能的基因。


免疫系统 – 研究人员确定了一些基因,它们构成了考拉对其受影响的某些疾病具有抵抗性、免疫性或易感性的基础。他们还发现了“基因组侵袭”(他们的说法)的证明,确认考拉逆转录病毒确实插入了基因组。


遗传学多样化 – 研究人员还检查了地质学事件,例如栖息地屏障和地面温度如何塑造遗传学多样化和种群进化。他们发现,来自不同区域的考拉在遗传学多样化方面存在显著差异,有证据表明这种多样化(或缺乏多样化)与自然屏障(例如,Hunter Valley)有关。


AWS 提供支持


产生完整的基因序列需要惊人的计算能力和海量存储(以及许多其他要求)。


虽然我不未完全了解此流程,但是我知道它自下而上的工作原理。DNA 样本分成可管理的小份,每一份都包含数万个碱基对。使用各种化学物质产生不同的碱基组成(A、T、C 或 G)使其发出荧光,然后捕获、测量并存储形成的发射数据。由于此研究生成了考拉参考基因组,因此使用在 AWS 上运行的名为 Falcon 的重叠布局共同序列算法组合测序读取数据。考拉基因组在 34.2 亿个碱基对后出现,比人类基因组略高。


我很高兴在报告,这项突破性工作是在 AWS 上进行的。研究团队使用 cfnCluster 形成了多个簇,各包含 500 到 1000 vCPU,从 Pacific Biosciences 上运行 Falcon。总的来说,该团队使用 300 万 EC2 核小时,其中大多数是 EC2 Spot 实例。获得灵活的低成本计算能力后,生物信息学团队能够使用他们换用的 Falcon 管道配置进行实验,并适应其工作负荷。


我们非常高兴,在这项有趣且价值无量的研究中贡献了自己的微薄力量!


作者介绍:


Jeff Barr


AWS 首席布道师; 2004年开始发布博客,此后便笔耕不辍。
复制代码


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/saving-koalas-using-genomics-research-and-cloud-computing/


2019-10-17 09:00959
用户头像

发布了 1930 篇内容, 共 159.1 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

AIGEO重塑商业新规则

跑一跑

geoai

节日季不再错过,跨境电商品牌如何精准引爆销量?

Wolink

节日 出海企业 海外营销推广 沃链Wolink 达人营销

面试常考:项目上线之后,出现过线上问题吗?怎么排查和解决的?

王中阳Go

面试

前端日志回捞系统的性能优化实践|得物技术

得物技术

性能优化 前端 大前端

适合中小企业的用户行为分析解决方案-ClkLog开源埋点与用户行为分析系统

ClkLog

开源 数据分析 埋点 用户画像 私有化部署

【干货篇】HTTP和SOCKS5代理协议核心区别全解析

kookeey严选代理

HTTP API SOCKS5 住宅ip 海外IP

绿茵逐梦,全民共享!中国绿发以足球之力助燃健康中国

最新动态

AIGEO:地理空间分析新利器

跑一跑

geoai

【湖南师范大学主办】第二届教育人工智能国际学术会议(ISAIE 2025)

搞科研的小刘

国际学术会议 教育人工智能

大道至简: CBuild-ng 让 Linux 根文件系统和复杂应用构建前所未有的简单

lengjingzju

开源 架构 DevOps 编译 框架

数据分析与AI丨如何用数据分析找到更优的橡胶配方?

Altair RapidMiner

人工智能 AI 数据分析 制造业 RapidMiner

2025年中国十大低代码平台排名:助力企业精准选型数字化转型工具

科技热闻

Pickle 发布 Whisper 主动式桌面 AI; 吴恩达:不懂计算机原理,就不可能只靠「Vibe Code」变优秀丨日报

声网

CST软件如何计算和导出部分模式的S参数

思茂信息

cst CST软件 CST Studio Suite

数据挖掘与隐私:你真的匿名了吗?

qife122

数据挖掘 匿名化

AI应用进化论(下):Fabarta个人专属智能体的技术实现路径思考

Fabarta

人工智能 智能体

清源SCA社区版更新(V4.2.0)|漏洞前置感知、精准修复、合规清晰,筑牢软件供应链安全防线!

安势信息

SCA 软件供应链安全 安势信息 清源SCA社区版 清源

Karmada v1.15 版本发布!多模板工作负载资源感知能力增强

华为云开发者联盟

Kubernetes 云原生 华为云 华为云开发者联盟

亿值旺的全球化战略:以创新链接世界

科技热闻

打破场景边界,支付宝联合实况窗提供全新出行服务体验

HarmonyOS SDK

HarmonyOS NEXT

《十六进制觉醒》:与我们一起,探索AI与数据的无限可能!​​

字节跳动数据平台

国产认证是什么?国产认证意义是什么?

行云管家

国产化 国产认证

AI GEO开启行业新机遇

跑一跑

geoai

项目调度管理系统(源码+文档+讲解+演示)

深圳亥时科技

#开源

对话式 AI Workshop|零帧起手捏个「 Her」——搭建拥有个人记忆的语音助手

声网

AI技术在英语听力练习APP中的应用

北京木奇移动技术有限公司

软件外包公司 AI英语学习 AI英语口语

PyTorch

数新网络官方账号

CRC32 自包含退化现象分析

Databend

自从切到 Qoder 开发后,每天都心旷神怡

阿里巴巴云原生

从临沂商城到全球网商批发电商的崛起之路

极客天地

MyEMS 开源能源管理系统:安装部署、常见问题与未来趋势

开源能源管理系统

开源 能源管理系统

使用基因组学研究和云计算拯救考拉_文化 & 方法_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章