阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

寻找新冠致重症因素,如何通过云计算将分析时间缩短 6 倍?

  • 2020-06-03
  • 本文字数:1385 字

    阅读完需:约 5 分钟

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?

阿里云高性能计算团队协助中山大学使用阿里云高性能计算服务进行生物信息科学计算,在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时,大大提高了工作效率。


国内疫情稍有缓和,但公共科研机构与病毒间的战争从未停止。科研人员与医疗工作者们依然在日以继夜地研究着这名“对手”,追溯它从何而来、如何“作恶”,我们又能如何消灭它。科技早已作为科研人员的后盾,他们背后有无数的计算力在为分析病毒而跳动着。


在这些与病毒持续搏斗的科研机构中,就有中山大学医学院,这也是疫情期间阿里云提供免费算力支持的机构之一。

中大医学院尝试寻找致重症的因素

在国内疫情肆虐之际,中山大学医学院通过与多家医院、疾控中心等合作,计划获取超过千名武汉市新冠患者的核酸样本,以及部分病人的全病程数据,希望通过基因组测序及测序数据分析,阐述冠状病毒的起源、进化和致重症机制。



中山大学医学院施莽老师解释,研究人员主要是从病原体本身、微环境(与病原体共感染的细菌/微生物),及宿主即人类的免疫系统三个方面的角度去寻找引发重症的因素。


中山大学医学院使用宏转录组的方法,期望从中原始样本中挖掘得到所有关键的遗传信息。科学家们通过分析这些遗传信息重现病原体感染、宿主免疫和机体内环境相互作用的动态过程,寻找导致机体重症的关键因素。


只有全面了解了重症因素,才可以在临床上进行重症预警,医生可以及早干预,对症下药;并指导缓解和预防重症的药物研发。


此外,科学家会将分析后的临床信息、病毒信息、基因组信息和实验结果数据汇总,构建新冠感染相关大数据,帮助研究病毒起源,也方便后续研究。

阿里云 EHPC,让数据分析性能提升 25%

在研究过程中,科学家首先需要通过高通量基因测序平台,对原始样本进行测序,获得样本中包括病毒、细菌和宿主的完整遗传信息。但这些信息仅是片段化的信息,需要进一步的生物信息学分析(包括序列的拼接和注释)才能解读采样的时间点病人体内正在发生的重要生命过程。



从基因测序到获得全基因组信息的过程


遗传信息的拼装和比对需要高性能计算进行处理,海量的数据更是需要大规模算力。


本次实验处理的病例超过 1000 人,一般病例至少采集两份数据,单份数据就有 2-3G,部分病例为了采集全病程数据还采样数十次,还要再加上对照组信息。同时,中山大学的科学家还需要下载美国国家生物信息中心 NCBI(National Center for Biotechnology Information)中的约 8000 个样品进行比对,其产生的数据之海量可想而知。


在分秒必争的疫情背景下,云上高性能计算的优势凸显,可加快研究进程。


阿里云帮助中山大学整合了从原始数据到获得最后分析结果的完整计算流程,云服务的弹性能够在短时间内快速交付丰富的算力资源, 通过阿里云高性能计算(EHPC)一键部署超算集群环境,根据需求动态增减集群节点,免去了研究人员们针对服务器的管理和维护,不需要在运维上耗费过多精力,只需专注在研究上。


同时,阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25%以上。


在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时。原本需要 1 年的运算量缩减到了约 2 个月时间,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。


2020-06-03 14:241366

评论

发布
暂无评论
发现更多内容

为什么阿里人成长速度极快?看完他们 Java 架构进化笔记,值得学习

Java-fenn

Java 程序员 java面试 Java学习 Java面试题

HUAWEI DevEco Testing注入攻击测试:以攻为守,守护OpenHarmony终端安全

OpenHarmony开发者

OpenHarmony

高并发之缓存

源字节1号

软件开发

华为云快成长直播间大数据&AI专场,加速经济物联网智能化提升

科技怪咖

推荐|海泰国密通信安全解决方案 助力用户实现安全合规

电子信息发烧客

阿里云张新涛:连接产业上下游,构建XR协作生态

阿里云弹性计算

交互 XR 视觉计算 沉浸式体验

如何设计企业级数据埋点采集方案?

字节跳动数据平台

数据分析 用户增长 埋点 数据应用 埋点设计

“双减”一年,如何让教育回归本质?

旺链科技

区块链 产业区块链 企业号九月金秋榜 教培行业

预约直播 | 大规模稀疏模型演进与DeepRec

阿里云大数据AI技术

开源项目 AI技术 模型稀疏训练

漏洞修复实用指南

SEAL安全

开源 漏洞 安全漏洞 漏洞修复 开源漏洞

面试造火箭!连续轰炸50问,我却靠这些"java复习宝典"一一攻克!

收到请回复

Java 云计算 开源 架构 编程语言

Paper Time|开放式时空大数据助力智能公交路线规划

OceanBase 数据库

头大了,Mysql写入数据十几秒后被自动删除了

南城FE

MySQL 前端 nodejs

关关难过关关过!2022年BAT面试通关秘籍:面前规划+面试题集+简历优化+面经分享等!

收到请回复

Java 云计算 开源 架构 编程语言

阿里大佬力荐6篇实战文档:JVM+多线程+Kafka+Redis+Nginx+MySQL,你确定不看?

收到请回复

Java 云计算 开源 架构 编程语言

使用 FSM 管理 osm-edge 服务网格入口流量

Flomesh

Service Mesh 服务网格

恍然大悟,才知道什么是真正的思维导图!

博文视点Broadview

亿级日志队列回放性能测试初探

FunTester

小红书自研小程序:电商体验与效果优化的运行时体系设计

小红书技术REDtech

小程序 前端 小程序运行时

Github点击破百万!这部《从零开始学架构》神书就此霸榜

Java-fenn

Java 程序员 java面试 Java书籍 Java面试题

关于用户 email 邮件地址是否允许有加号的问题

Jerry Wang

typescript 正则表达式 邮件 9月月更 输入校验

变革加速,博睿数据赋能“中国智造”转型升级

博睿数据

可观测性 智能运维 博睿数据

华为云快成长直播ERP专场,以数据驱动企业智慧变革

科技怪咖

全新演绎!美团内部疯传Spring Boot速成手册也太香了叭!

收到请回复

Java 云计算 开源 架构 编程语言

大数据ELK(一):集中式日志协议栈Elastic Stack简介

Lansonli

ELK 9月月更

“大厂”角力移动办公系统市场,钉钉和企微向左、WorkPlus向右

WorkPlus

【指针内功修炼】字符指针 + 指针数组 + 数组指针 + 指针参数(一)

Albert Edison

C语言 二维数组 9月月更 指针数组 数组指针

想成为数据科学家,哪些技能你必须具备?

雨果

手把手教大家编译 flowable 源码

江南一点雨

Java workflow flowable

从零到一构建完整知识体系,阿里最新SpringBoot原理最佳实践真香

程序员小毕

Java spring 源码 面试 SpringBoot 2

算法基础(二)| 高精度算法详解

timerring

算法 9月月更

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?_服务革新_阿里云弹性计算_InfoQ精选文章