写点什么

寻找新冠致重症因素,如何通过云计算将分析时间缩短 6 倍?

  • 2020-06-03
  • 本文字数:1385 字

    阅读完需:约 5 分钟

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?

阿里云高性能计算团队协助中山大学使用阿里云高性能计算服务进行生物信息科学计算,在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时,大大提高了工作效率。


国内疫情稍有缓和,但公共科研机构与病毒间的战争从未停止。科研人员与医疗工作者们依然在日以继夜地研究着这名“对手”,追溯它从何而来、如何“作恶”,我们又能如何消灭它。科技早已作为科研人员的后盾,他们背后有无数的计算力在为分析病毒而跳动着。


在这些与病毒持续搏斗的科研机构中,就有中山大学医学院,这也是疫情期间阿里云提供免费算力支持的机构之一。

中大医学院尝试寻找致重症的因素

在国内疫情肆虐之际,中山大学医学院通过与多家医院、疾控中心等合作,计划获取超过千名武汉市新冠患者的核酸样本,以及部分病人的全病程数据,希望通过基因组测序及测序数据分析,阐述冠状病毒的起源、进化和致重症机制。



中山大学医学院施莽老师解释,研究人员主要是从病原体本身、微环境(与病原体共感染的细菌/微生物),及宿主即人类的免疫系统三个方面的角度去寻找引发重症的因素。


中山大学医学院使用宏转录组的方法,期望从中原始样本中挖掘得到所有关键的遗传信息。科学家们通过分析这些遗传信息重现病原体感染、宿主免疫和机体内环境相互作用的动态过程,寻找导致机体重症的关键因素。


只有全面了解了重症因素,才可以在临床上进行重症预警,医生可以及早干预,对症下药;并指导缓解和预防重症的药物研发。


此外,科学家会将分析后的临床信息、病毒信息、基因组信息和实验结果数据汇总,构建新冠感染相关大数据,帮助研究病毒起源,也方便后续研究。

阿里云 EHPC,让数据分析性能提升 25%

在研究过程中,科学家首先需要通过高通量基因测序平台,对原始样本进行测序,获得样本中包括病毒、细菌和宿主的完整遗传信息。但这些信息仅是片段化的信息,需要进一步的生物信息学分析(包括序列的拼接和注释)才能解读采样的时间点病人体内正在发生的重要生命过程。



从基因测序到获得全基因组信息的过程


遗传信息的拼装和比对需要高性能计算进行处理,海量的数据更是需要大规模算力。


本次实验处理的病例超过 1000 人,一般病例至少采集两份数据,单份数据就有 2-3G,部分病例为了采集全病程数据还采样数十次,还要再加上对照组信息。同时,中山大学的科学家还需要下载美国国家生物信息中心 NCBI(National Center for Biotechnology Information)中的约 8000 个样品进行比对,其产生的数据之海量可想而知。


在分秒必争的疫情背景下,云上高性能计算的优势凸显,可加快研究进程。


阿里云帮助中山大学整合了从原始数据到获得最后分析结果的完整计算流程,云服务的弹性能够在短时间内快速交付丰富的算力资源, 通过阿里云高性能计算(EHPC)一键部署超算集群环境,根据需求动态增减集群节点,免去了研究人员们针对服务器的管理和维护,不需要在运维上耗费过多精力,只需专注在研究上。


同时,阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25%以上。


在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时。原本需要 1 年的运算量缩减到了约 2 个月时间,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。


2020-06-03 14:241633

评论

发布
暂无评论
发现更多内容

用机器学习操控无人驾驶小车,竟然和训练狗狗的原理一样!?

亚马逊云科技 (Amazon Web Services)

HDFS

xujiangniao

zookeeper的架构

大数据技术指南

zookeeper 5月日更

一个江南皮鞋厂的小故事带我理解透了——什么是“代理模式”

Java架构师迁哥

流媒体:依托于声网的连麦解决方案

小岛上的黑桃六

架构 音视频 架构师 流媒体 声网

Android中绘制圆角的三种方式

teoking

android

万丈高楼平地起,爆肝21000字Java基础知识总结,收藏起来总有用得着的时候

北游学Java

Java 集合 线程池 IO流

数据仓库分层架构及元数据管理

五分钟学大数据

数据仓库

HDFS的HA以及Yarn的HA高可用

五分钟学大数据

hdfs YARN 5月日更

高并发之存储篇:关注下索引原理和优化吧!躲得过实践,躲不过面试官!

Coder的技术之路

数据库 高并发 索引结构 索引优化

从简历被拒到收割8个大厂offer,我用了3个月成功破茧成蝶

比伯

Java 编程 架构 面试 计算机

大四实习生”都四面成功拿到字节跳动Offer了,你还有什么理由去摸鱼?

学Java关注我

Java 编程 架构 面试 计算机

架构师实战营,模块三:架构设计详细文档

ifc177

#架构实战营

高并发系列:架构优化之从BAT实际案例看消息中间件的妙用

Coder的技术之路

高并发 高并发系统设计 消息队列 消息中间件

高并发系列:存储优化之也许可能是史上最详尽的分库分表文章之一

Coder的技术之路

高并发 分库分表 高并发系统设计

GitHub Actions:真正的 DevOps CI

大龄程序员老羊

架构 DevOps 持续集成 Github Actions NoOps

YARN资源调度三种模型介绍

五分钟学大数据

YARN

回顾 Alex Smola 讲述的“自动化机器学习(AutoML)”,本文带你了解 AutoGluon!

亚马逊云科技 (Amazon Web Services)

MapReduce

xujiangniao

破茧成蝶!从投简历石沉大海到收割5个大厂offer,我只刷了这套面试题!

Java架构追梦

Java 阿里巴巴 架构 面试 offer

全靠这套大厂Java面试题目指南,让我成功斩获 25*16 薪资的offer

飞飞JAva

Java

Vue 组件通信的 8 种方式

程序员海军

Vue 大前端 组件通信 引航计划

云图说|云数据库MySQL内核小版本升级全攻略

华为云开发者联盟

MySQL 云数据库 内核 华为云数据库 小版本升级

【LeetCode】解码异或后的数组Java题解

Albert

算法 LeetCode 5月日更

专家解惑 | 关于华为云盘古大模型,你想问的都在这里~

华为云开发者联盟

计算机视觉 nlp 华为云 盘古大模型 预训练

yarn的多租户配置实现资源隔离

五分钟学大数据

YARN

Python打包后的EXE文件,如何获取同级目录

IT蜗壳-Tango

5月日更

GitHub开源的最全中文诗歌古典文集数据库

不脱发的程序猿

GitHub 开源 程序人生 中华古典文集数据库

Java面试:BIO,NIO,AIO 的区别,别再傻傻分不清楚

Java大蜗牛

Java 程序员 面试 编程语言 后端

架构训练营-作业三(消息队列详细架构设计文档)

eoeoeo

架构实战营

如何高效率的度过一天?

程序员海军

效率 方法论

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?_服务革新_阿里云弹性计算_InfoQ精选文章