你在使用哪种编程语言?快来投票,亲手选出你心目中的编程语言之王 了解详情
写点什么

寻找新冠致重症因素,如何通过云计算将分析时间缩短 6 倍?

2020 年 6 月 03 日

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?

阿里云高性能计算团队协助中山大学使用阿里云高性能计算服务进行生物信息科学计算,在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时,大大提高了工作效率。


国内疫情稍有缓和,但公共科研机构与病毒间的战争从未停止。科研人员与医疗工作者们依然在日以继夜地研究着这名“对手”,追溯它从何而来、如何“作恶”,我们又能如何消灭它。科技早已作为科研人员的后盾,他们背后有无数的计算力在为分析病毒而跳动着。


在这些与病毒持续搏斗的科研机构中,就有中山大学医学院,这也是疫情期间阿里云提供免费算力支持的机构之一。


中大医学院尝试寻找致重症的因素

在国内疫情肆虐之际,中山大学医学院通过与多家医院、疾控中心等合作,计划获取超过千名武汉市新冠患者的核酸样本,以及部分病人的全病程数据,希望通过基因组测序及测序数据分析,阐述冠状病毒的起源、进化和致重症机制。



中山大学医学院施莽老师解释,研究人员主要是从病原体本身、微环境(与病原体共感染的细菌/微生物),及宿主即人类的免疫系统三个方面的角度去寻找引发重症的因素。


中山大学医学院使用宏转录组的方法,期望从中原始样本中挖掘得到所有关键的遗传信息。科学家们通过分析这些遗传信息重现病原体感染、宿主免疫和机体内环境相互作用的动态过程,寻找导致机体重症的关键因素。


只有全面了解了重症因素,才可以在临床上进行重症预警,医生可以及早干预,对症下药;并指导缓解和预防重症的药物研发。


此外,科学家会将分析后的临床信息、病毒信息、基因组信息和实验结果数据汇总,构建新冠感染相关大数据,帮助研究病毒起源,也方便后续研究。


阿里云 EHPC,让数据分析性能提升 25%

在研究过程中,科学家首先需要通过高通量基因测序平台,对原始样本进行测序,获得样本中包括病毒、细菌和宿主的完整遗传信息。但这些信息仅是片段化的信息,需要进一步的生物信息学分析(包括序列的拼接和注释)才能解读采样的时间点病人体内正在发生的重要生命过程。



从基因测序到获得全基因组信息的过程


遗传信息的拼装和比对需要高性能计算进行处理,海量的数据更是需要大规模算力。


本次实验处理的病例超过 1000 人,一般病例至少采集两份数据,单份数据就有 2-3G,部分病例为了采集全病程数据还采样数十次,还要再加上对照组信息。同时,中山大学的科学家还需要下载美国国家生物信息中心 NCBI(National Center for Biotechnology Information)中的约 8000 个样品进行比对,其产生的数据之海量可想而知。


在分秒必争的疫情背景下,云上高性能计算的优势凸显,可加快研究进程。


阿里云帮助中山大学整合了从原始数据到获得最后分析结果的完整计算流程,云服务的弹性能够在短时间内快速交付丰富的算力资源, 通过阿里云高性能计算(EHPC)一键部署超算集群环境,根据需求动态增减集群节点,免去了研究人员们针对服务器的管理和维护,不需要在运维上耗费过多精力,只需专注在研究上。


同时,阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25%以上。


在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时。原本需要 1 年的运算量缩减到了约 2 个月时间,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。


2020 年 6 月 03 日 14:24979

评论

发布
暂无评论
发现更多内容

架构师训练营第一期 - 第五周学习总结

卖猪肉的大叔

架構師訓練營第 1 期 - 第 05 周作業

Panda

架構師訓練營第 1 期

既不能神化,也不要泛化区块链

CECBC区块链专委会

金融 数字技术

保证缓存与数据库的数据一致性不是很容易

架构师修行之路

缓存 一致性

架构师训练营第 1 期第 6 周作业

业哥

算法训练营毕业总结——以此自勉

Airship

算法 算法和数据结构

马云:数字货币可能会重新定义货币

CECBC区块链专委会

金融

第五周课后总结

饭桶

黑幕!爆京东18A技术专家纯手打:小团队构建大网站架构实战

996小迁

Java 学习 架构 面试 笔记

ARTS打卡 第21周

引花眠

微服务 ARTS 打卡计划 springboot

一文带你掌握Redis操作指南

华为云开发者社区

数据库 存储

穆长春:数字人民币“双离线”支付开发完毕后续将试点

CECBC区块链专委会

数字钱包

蚂蚁金服Java三面面经:二叉树+HTTPS加密+自旋锁+缓存穿透(附答案)

Java架构之路

Java 程序员 架构 面试 编程语言

程序员跳槽,只要用好(2+2)方法论,绝对可以找到一家好公司

Java架构师迁哥

Javaer 进阶必看的 RocketMQ ,就这篇了

yes

RocketMQ 消息队列

二十四、深入Python多进程multiprocessing模块

刘润森

Python

现场突击京东程序员的购物车!看看"11.11"都买啥?

京东科技开发者

程序人生

缓存架构不够好,系统容易瘫痪

架构师修行之路

缓存 微服务 架构设计

你用过宏##粘贴函数,然后用函数指针查找执行吗?今天就给你说道说道

良知犹存

c c++

甲方日常 38

句子

工作 随笔杂谈 日常

分布式关系数据库

韩向民

SpringCloud Alibaba开篇:SpringCloud这么火,为何还要学习SpringCloud Alibaba?

冰河

分布式 微服务 高性能 SpringCloud Alibaba

LeetCode题解:46. 全排列,回溯,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

云原生2.0时代:开启应用定义基础设施新时代

华为云开发者社区

容器 云原生

架构师训练营第一期 - 第五周课后作业

卖猪肉的大叔

第五周课后练习

饭桶

一笔订单,但是误付了两笔钱!这种重复付款异常到底该如何解决?

楼下小黑哥

支付宝 微信支付 支付系统 支付

1分钟带你入门 React 生命周期

Leo

react.js 前端 React 生命周期 前端进阶训练营

openEuler进化记:一颗探索宇宙的生态之星

脑极体

这里有一份Java程序员的珍藏书单,请您注意查收

捡田螺的小男孩

Java 后端 PDF

网易首席架构师2年心血只为趣谈网络协议,内容强不强你说了算

周老师

Java 编程 程序员 架构 面试

技术为帆,纵横四海- Lazada技术东南亚探索和成长之旅

技术为帆,纵横四海- Lazada技术东南亚探索和成长之旅

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?-InfoQ