写点什么

AI 提供算力支撑:新型冠状病毒所有关键蛋白质同源模建结果和方法公布

2020 年 2 月 11 日

AI提供算力支撑:新型冠状病毒所有关键蛋白质同源模建结果和方法公布

面对当前新型冠状病毒(2019-nCoV)感染肺炎不断扩散的严峻形势,华为云 EI 医疗智能体团队联合华中科技大学同济医学院基础医学院李岩教授,西安交通大学第一附属医院刘冰教授,中科院北京基因组研究所韩大力研究员,华中科技大学同济医学院附属武汉儿童医院柯尊辉大夫组成联合攻关团队,针对新型冠状病毒(2019-nCoV)的多个靶标蛋白进行了超大规模计算机辅助药物筛选工作。筛选出五种可能对 2019 新型冠状病毒(2019-nCoV)有效的抗病毒药物。现将联合科研团队对 2019 新型冠状病毒所有关键蛋白质同源模建结果和方法公布。


背景介绍

蛋白质同源建模

蛋白质同源建模是指当未知结构的蛋白和已知结构的蛋白质在一级序列上比较相似的时候,可以把已知结构的蛋白作为模板,通过计算机的模拟和计算,基于未知结构蛋白的一级序列预测其三维空间结构。同源建模基于两个假设:1. 蛋白质的结构由其氨基酸序列唯一决定,如果已经知道一级序列,在理论上就可以获取其二级结构以及三级结构。2. 蛋白质的三级结构在进化中相比于其一级序列更加保守。如果两个蛋白质的氨基酸序列有 50% 相同,那么约有 90% 的 a- 碳原子的位置偏差不超过 3 Å。


以 SARS-CoV 为模板构建 2019-nCoV 三维结构

2019-nCoV 和 SARS-CoV 非常近似,氨基酸的序列一致性达到了 76.47%。同时 SARS-COV 的蛋白质的三维结构基本上已经被解析出来,所以我们可通过这些已知的蛋白质三维结构作为模板,构建 2019-nCoV 的蛋白质结构,并进而指导药物研发。


数据和方法

2019-nCoV 蛋白质一级序列提取 2019-nCoV 的基因组序列参考 NCBI 上已公开的序列:NC_045512.2。由于基因组注释数据的缺失,无法直接获取其所有功能蛋白质的一级序列。因此我们将 SARS-CoV 的各个蛋白对应的序列比对到 2019-nCoV 基因组上,选择 best match 的比对区域,作为该蛋白对应的在 2019-nCoV 的一级序列。通过这种方法,我们获得了 2019-nCoV 的共计 20 个蛋白质的序列,其中包含非结构蛋白 16 个(NSP1-16),结构蛋白 4 个(S,M,N,E)。


同源建模

Swiss model 用于同源建模

Swiss-model 是自动化蛋白质同源建模工具,使用的过程中需要用户输入目的蛋白的序列,也可以同时指定参考蛋白质模板,在没有指定模板的情况下,系统会自动选择匹配度最高的模板。我们在通过 Swiss-model 做同源建模的步骤和结果如下:


Step 1: 输入蛋白质序列

在 swiss-model 主页 (https://swissmodel.expasy.org/) 点击“Start modeling”并上传蛋白质的 fasta 序列。点击“Search For Templates”,开始搜索最模板蛋白。



Step 2: 选择合适的模板蛋白

Swiss-model 会给出通过一级序列匹配到的模板蛋白,以及每一个模板蛋白的匹配度和模板蛋白的参数,通过以下标准,我们选择最优的模板蛋白用于同源建模:


  1. 目的蛋白和模板蛋白一级序列一致性要求:identity>30%;优先选择 identity 最高的模板蛋白;

  2. 优先选择 SARS-COV 的模板蛋白用于同源建模;

  3. 当 identity 比较相似的时候,优先选择通过高精度 X-ray 方法构建晶体结构的模板;如果没有 X-ray,需要点进 PDB 看蛋白结构分辨率,优先选分辨率高的;

  4. 如果 Oligo State 存在有 Homo 和 heter,就两个都要选择。



Step 3: 同源建模

选定好最优的模板蛋白之后,点击页面的“Build Models”,即可自动的做同源建模;对于序列比较短的蛋白(<100 残基),该过程通常花费几分钟;对于序列比较长的蛋白(="">1000 残基),该过程通常花费约二十分钟左右;建模完成后,可直接下载模板蛋白和目的蛋白的三维空间结构用于后续的分析。



Step 4: 分子动力学模拟

同源建模得到的蛋白质结构可以用于分子动力学(Molecular Dynamics)模拟。分子动力学模拟可以通过 GROMACS 等工具完成,这一步骤通常比较耗时。华为云医疗智能体平台已经提供加速版的 GROMACS,加速后的 GROMACS 消耗的时间仅有传统版本的 1/6。



结果

建模结果

统计针对 2019-nCOV 的 20 个蛋白质一级序列,有 15 个蛋白和 SARS-COV 的蛋白质有比较高的同源性,identity>70%;通过蛋白质三维工具可视化之后,也可以看到这些蛋白质的三维空间构象和模板蛋白比较相似;其中有一个蛋白质,NSP4,在 SARS-COV 中没有很好的同源蛋白,是以小鼠肝炎病毒的 A59 进行建模,其 identity>60%;另外有四个蛋白质的同源建模效果不是很好,其中 NSP2,NSP6 和 M 均没有很好的目的模板,匹配度最好的蛋白质序列的 identity < 30%;所以建模的结果不太理想;同时 NSP11 蛋白质的长度只有 11 个残基,长度太短,不满足建模要求;目的蛋白的长度,模板蛋白的选择和同源建模的参数整理在以下的表格中供参考:



数据和可视化

模板蛋白和同源建模得到的 2019-nCoV 蛋白质三维结构都以 PDB 格式进行保存,为了方便用户查阅,华为云医疗智能体平台的 Notebook 工具已经内置了可视化所需要的插件和工具,用户可以交互式拖动和展示感兴趣的蛋白质三维结构。



以上涉及到的数据、算法和工具都已经集成在华为云医疗智能体平台,基于华为云 AI 昇腾集群服务的强大算力,用户可省时省力地完成端到端的分析。


网站链接:https://www.huaweicloud.com/product/eihealth.html


实验结果:https://bbs.huaweicloud.com/blogs/144950


2020 年 2 月 11 日 13:321106

评论

发布
暂无评论
发现更多内容

electron实战练习-三个文件实现一个命令行终端

OBKoro1

node.js Electron electron实战 命令行终端 electron学习

顶级!13位专家力荐Spring5为企业级开发提供一站式方案

996小迁

Java spring 编程 架构 面试

太牛了!Alibaba架构师耗时72天总结整理的700页Java进阶架构师宝典。

Java成神之路

Java 程序员 架构 面试 编程语言

阿里中间件团队技术官手撸笔记,全新演绎“Kafka部署实战”,已开源

Java架构之路

Java 程序员 架构 面试 编程语言

盘点2020| 开启小马哥的新未来

小马哥

盘点2020

从美国《拜杜法案》到中国供应链体系形成的内在逻辑

JiangX

供应链 28天写作 制造

宝藏!Github上标星45K+的《Java核心神技笔记整理》,吃透消化,面试跳槽不心慌!

Java成神之路

Java 程序员 架构 面试 编程语言

毕业3年,月薪从10K到30K,万分感慨 “数据结构与算法真实太TM重要了!”

Java成神之路

Java 程序员 架构 面试 编程语言

工业传感器:工业互联网的第一道门

浪潮云

工业互联网

mysql字符串字段索引优化

瞌睡的李先生

MySQL 索引

跨越全场景统一架构三大挑战,MindSpore亮出“四招”

华为云开发者社区

深度学习 联邦学习 mindspore 算子 ai框架

研发管理101军规#003 实战规模化敏捷:从8人到百人的敏捷之路

PingCode

程序人生 Scrum 敏捷开发

新鲜出炉!阿里内部开源SpringCloud Alibaba全解(全彩版)全网首发

Java架构追梦

Java 架构 面试 学习笔记 SpringCloud Alibaba

高频量化交易机器人系统开发|高频量化交易机器人APP软件开发

开發I852946OIIO

系统开发

再造淘宝电商项目落地,从零开始搭建亿级系统架构笔记,直接让你拥有高并发设计经验!

Java成神之路

Java 程序员 架构 面试 编程语言

Java 异常处理

学个球

Java java异常处理

科技赋能传统产业:工业绿色可视化—核电站工艺流程组态仿真

一只数据鲸鱼

物联网 数据可视化 组态软件 绿色工业 核电站

看图学NumPy:掌握n维数组基础知识点,看这一篇就够了

华为云开发者社区

Python 机器学习 数组 Numpy

Serverless 在 SaaS 领域的最佳实践

Serverless Devs

Serverless 云原生 SaaS

重学JS | 异步编程 Generator()

梁龙先森

前端 编程语言 面试题 28天写作

2020DevOps状态报告——变更管理

禅道项目管理

DevOps 运维 开发 趋势 自动化测试

阿里P8内部架构核心学习知识笔记在各大互联网上流传,限时开放下载

Java架构之路

Java 程序员 架构 面试 编程语言

APICloud的发展和应用

anyRTC开发者

ios android 跨平台 sdk APICloud

林昊获中国计算机学会杰出工程师奖,阿里中间件再获高度肯定,“三位一体”推动技术普惠

阿里巴巴云原生

阿里巴巴 阿里云 开发者 云原生 中间件

如何对AD和Exchange进行安全加固满足护网需要?

嘉为蓝鲸

安全 asm AD 邮件系统 权限

Java 程序经验小结:用私有构造器或者枚举类型强化Singleton属性

后台技术汇

28天写作

我以为自己够牛逼了,直到看到了Alibaba专家的面试笔记,我学习了三个月,却入职京东,税前36K

Java架构之路

Java 程序员 架构 面试 编程语言

快速入门案例实战:电商网站商品管理(一)

escray

elasticsearch elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

快抛弃你错误的坚持

石君

生活随想 28天写作

软件测试--selenium安装使用

测试人生路

软件测试

太牛了,Alibaba出品的这份《Java并发编程实践》文档,每一步操作都直击你的内心!

Java成神之路

Java 程序员 架构 面试 编程语言

演讲经验交流会|ArchSummit 上海站

演讲经验交流会|ArchSummit 上海站

AI提供算力支撑:新型冠状病毒所有关键蛋白质同源模建结果和方法公布-InfoQ