报名「音视频前端技术创新实践专场」,听腾讯云技术专家揭秘音视频相关技术>> 了解详情
写点什么

寻找新冠致重症因素,如何通过云计算将分析时间缩短 6 倍?

  • 2020 年 6 月 03 日
  • 本文字数:1385 字

    阅读完需:约 5 分钟

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?

阿里云高性能计算团队协助中山大学使用阿里云高性能计算服务进行生物信息科学计算,在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时,大大提高了工作效率。


国内疫情稍有缓和,但公共科研机构与病毒间的战争从未停止。科研人员与医疗工作者们依然在日以继夜地研究着这名“对手”,追溯它从何而来、如何“作恶”,我们又能如何消灭它。科技早已作为科研人员的后盾,他们背后有无数的计算力在为分析病毒而跳动着。


在这些与病毒持续搏斗的科研机构中,就有中山大学医学院,这也是疫情期间阿里云提供免费算力支持的机构之一。


中大医学院尝试寻找致重症的因素

在国内疫情肆虐之际,中山大学医学院通过与多家医院、疾控中心等合作,计划获取超过千名武汉市新冠患者的核酸样本,以及部分病人的全病程数据,希望通过基因组测序及测序数据分析,阐述冠状病毒的起源、进化和致重症机制。



中山大学医学院施莽老师解释,研究人员主要是从病原体本身、微环境(与病原体共感染的细菌/微生物),及宿主即人类的免疫系统三个方面的角度去寻找引发重症的因素。


中山大学医学院使用宏转录组的方法,期望从中原始样本中挖掘得到所有关键的遗传信息。科学家们通过分析这些遗传信息重现病原体感染、宿主免疫和机体内环境相互作用的动态过程,寻找导致机体重症的关键因素。


只有全面了解了重症因素,才可以在临床上进行重症预警,医生可以及早干预,对症下药;并指导缓解和预防重症的药物研发。


此外,科学家会将分析后的临床信息、病毒信息、基因组信息和实验结果数据汇总,构建新冠感染相关大数据,帮助研究病毒起源,也方便后续研究。


阿里云 EHPC,让数据分析性能提升 25%

在研究过程中,科学家首先需要通过高通量基因测序平台,对原始样本进行测序,获得样本中包括病毒、细菌和宿主的完整遗传信息。但这些信息仅是片段化的信息,需要进一步的生物信息学分析(包括序列的拼接和注释)才能解读采样的时间点病人体内正在发生的重要生命过程。



从基因测序到获得全基因组信息的过程


遗传信息的拼装和比对需要高性能计算进行处理,海量的数据更是需要大规模算力。


本次实验处理的病例超过 1000 人,一般病例至少采集两份数据,单份数据就有 2-3G,部分病例为了采集全病程数据还采样数十次,还要再加上对照组信息。同时,中山大学的科学家还需要下载美国国家生物信息中心 NCBI(National Center for Biotechnology Information)中的约 8000 个样品进行比对,其产生的数据之海量可想而知。


在分秒必争的疫情背景下,云上高性能计算的优势凸显,可加快研究进程。


阿里云帮助中山大学整合了从原始数据到获得最后分析结果的完整计算流程,云服务的弹性能够在短时间内快速交付丰富的算力资源, 通过阿里云高性能计算(EHPC)一键部署超算集群环境,根据需求动态增减集群节点,免去了研究人员们针对服务器的管理和维护,不需要在运维上耗费过多精力,只需专注在研究上。


同时,阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25%以上。


在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时。原本需要 1 年的运算量缩减到了约 2 个月时间,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。


2020 年 6 月 03 日 14:241027

评论

发布
暂无评论
发现更多内容

云栖大会|盛宴之下,共赴一场视频云的进化论

阿里云视频云

阿里云 音视频 WebRTC 视频云 云栖大会

百亿级系统架构首公开!阿里这份300多页的设计实录你还没有吗?

Java 程序员 架构 面试 后端

19. 删除链表的倒数第N个数(链表)

黄敏

解读鸿蒙轻内核的监控器:异常钩子函数

华为云开发者社区

鸿蒙 钩子函数 任务栈 OpenHarmony 异常钩子函数

涨薪60%,从美团干到阿里p7,这份Github上的面试笔记把所有Java知识都写出来了

Java 程序员 架构 面试 后端

Python 的 sum():Pythonic 的求和方法

华为云开发者社区

Python 列表 元组 Pythonic 求和

三面阿里,有惊无险成功拿到offer定级P7,只能说是真的难

Java 编程 java架构

主数据与主数据管理(数据治理)

KoLee

数据治理 数字化 主数据管理 主数据

编码规约

Rocky·Chen

WhatsApp 如何启用端到端加密备份数据

CatTalk

facebook 安全 端到端加密

Alibaba最新神作!耗时182天肝出来的1015页分布式全栈手册太香了

编程 程序员 IT 计算机 java

宁波市正规等保测评机构有几家?位于哪里?

行云管家

网络安全 等保 等保测评

Apache ShardingSphere 在京东白条场景的落地之旅

SphereEx

开源 数据架构 架构设计 ShardingSphere SphereEx

量化模拟线上流量实践

FunTester

性能测试 接口测试 测试框架 FunTester 线上流量

J2PaaS低代码平台的开源,将进一步助力企业数字化

J2PaaS低代码平台

低代码 低代码开发 低代码开发平台

Android技术分享| 【自习室】自定义View代替通知动画(1)

anyRTC开发者

android 音视频 WebRTC 在线教育 移动开发

元宇宙NFT区块链游戏系统开发

亿级流量架构演进实战 | 从零构建亿级流量API网关 01

然行

亿级架构

亿级流量架构演进实战 | 从零构建亿级流量API网关 02

然行

亿级架构

Python代码阅读(第37篇):获取两个列表中相同的元素

Felix

Python 编程 Code Programing 阅读代码

211本+985硕+计算机专业投面百度,坐等一周迎来三面,已拿offer

Java 学习 程序员 架构 大厂面试

DataOps(数据运维)指南 - 数据管理的新时代

信码由缰

DataOps

太绝了吧! 终于有人能把TCP/IP 协议讲的明明白白了

程序员 架构 面试 后端 java

第 17 章 -《Linux 一学就会》- Linux计划任务与日志的管理

学神来啦

Linux 运维 linux学习 linux云计算 linux基础

接连三次霸榜GitHub,这个国产GitHub项目是真的强...

百度开发者中心

最佳实践 方法论 百度飞桨 开源技术

遭 GitHub 连夜封杀下架?被泄露的阿里内部 Java 面试手册到底有多强?

收到请回复

Java 面试 阿里 大厂Offer

Elasticsearch 快照相关(qbit)

qbit

分布式缓存技术

黄敏

2021Flexera云报告:企业积极拥抱多云,但云上成本仍然居高不下

行云管家

区块链 云计算 企业上云 上云

面试官提问:如何通过sql方式将数据库表行转列?

Java 数据库 sql 面试 后端

性能加速最高可达28倍!这个NLP工具包不容错过

百度开发者中心

预训练模型 NLP 大模型

聊聊IO夯的那些事

聊聊IO夯的那些事

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?-InfoQ