NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

成功破解困扰生物学界 50 年的蛋白质折叠难题,DeepMind 的 AlphaFold 2 已宣布开源!

  • 2021-07-22
  • 本文字数:1708 字

    阅读完需:约 6 分钟

成功破解困扰生物学界50年的蛋白质折叠难题,DeepMind的AlphaFold 2已宣布开源!

蛋白质结构预测技术正在走向大众。广大科学家很快就能用上准确预测蛋白质 3D 形状的软件。


7 月 15 日,总部位于伦敦的 DeepMind 公司发布了该公司深度学习神经网络 AlphaFold 2 的一个开源版本,并在《自然》期刊的一篇论文中描述了其方法。该网络在去年的蛋白质结构预测竞赛中取得了领先地位


机器学习软件预测的人类白细胞介素 12 蛋白与其受体结合的结构。


与此同时,一个学术团队受 AlphaFold 2 的启发开发了自己的蛋白质预测工具,该工具已经受到了很多科学家的欢迎。他们的系统称为 RoseTTaFold,其性能接近 AlphaFold 2,具体信息发布在 7 月 15 日发表的《科学》期刊的一篇论文中。


伊利诺伊州芝加哥大学的计算生物学家 Jinbo Xu(他没有参与这两个项目)说,这些工具的开源性质意味着科学界应该能够在前沿技术的基础上开发出更强大、更有用的软件。

从结构到功能


蛋白质由氨基酸串组成,折叠成 3D 形状的氨基酸决定了这些蛋白质在细胞中的功能。几十年来,研究人员一直使用 X 射线晶体学和冷冻电子显微镜等实验技术来确定蛋白质结构。但是这样的方法既费时又费钱,而且一些蛋白质不适合这样的分析。


去年,DeepMind 的突破震动了科学界,这家公司展示了自己的软件仅使用蛋白质的序列(由 DNA 决定)就能准确预测许多蛋白质的结构。


几十年来,研究人员一直在努力应对这一挑战,而 AlphaFold 2 在两年一度的 CASP 蛋白质预测竞赛中表现如此出色,以至于该竞赛的联合创始人宣称“从某种意义上说,这个问题已经得到了解决”。


DeepMind(他们以对自身的工作守口如瓶而闻名)12 月 1 日在 CASP 的一场简短演讲中介绍了 AlphaFold 2。它承诺发表一篇更详细地介绍网络的论文,并将软件对研究人员开放,但除此之外就没多说什么了。


“在学术界有相当多的悲观情绪,”西雅图华盛顿大学的生物化学家 David Baker 说,他的团队开发了 RoseTTaFold。“如果有人解决了你正在攻关的问题,但没有透露他们是如何做到的,你接下来该怎么做呢?”


“当时我感觉自己丢了工作,”Baker 团队的成员、计算化学家 Minkyung Baek 说。但 DeepMind 的演讲也激发了 Baek 的很多新想法,让她迫不及待想要探索一番。因此,她、Baker 和他们的同事开始集思广益,设法复制 AlphaFold 2 的成功。


他们确定了几项关键进展,包括网络如何使用与研究人员试图预测的目标在进化上相关的蛋白质信息,以及蛋白质某一部分的预测结构如何影响网络处理与分子其他部分相对应的序列的方式。


RoseTTaFold 不仅表现非常接近 AlphaFold 2,而且比其他 CASP 对手(包括来自 Baker 实验室的一些项目)要好得多。


Baek 说,目前尚不清楚为什么它还比不上 AlphaFold 2,但一种可能性来自 DeepMind 的专业知识。“我们的实验室里没有任何深度学习工程师。”Xu 对 Baek、Baker 和他们同事的努力印象深刻,并猜想 DeepMind 的成功应该归功于他们的工程专业知识和卓越的计算能力。

快速推算结构


DeepMind 还简化了 AlphaFold 2。AlphaFold 首席研究员 JohnJumper 说,之前该网络需要几天的计算时间来为 CASP 的某些条目生成结构,但开源版本的速度大约快了 16 倍。它可以在几分钟到几小时内生成结构,具体取决于蛋白质的大小。这与 RoseTTaFold 的速度相当。


尽管 AlphaFold 2 的源代码是免费提供的——包括对商业实体也是如此——但对于没有技术专业知识的研究人员来说,它可能还不是特别有用。


DeepMind 的人工智能科学领域负责人 Pushmeet Kohli 表示,DeepMind 已经在和部分研究人员和组织,包括总部位于瑞士日内瓦的非营利性“被忽视疾病药物计划”展开合作,对特定目标进行预测。但这家公司也希望扩大这项技术的应用范围。“在这个领域,我们还有很多事情要做。”


除了免费提供 RoseTTaFold 的代码外,Baker 的团队还建立了一个服务器,研究人员可以在其中插入蛋白质序列并获得预测的结构。Baker 说,自上个月启动以来,该服务器已经预测了大约 500 人提交的 5,000 多种蛋白质的结构。


现在,RoseTTaFold 和 AlphaFold 2 的代码都可以免费获取,研究人员将能够在这两项突破的基础上再接再厉。Xu 说,也许科学家可以让这些技术应对 AlphaFold 2 之前还难以预测的蛋白质结构。两个非常受关注的领域分别是预测多种相互作用蛋白质复合物的结构,和将软件应用于新蛋白质的设计。


原文链接:


https://www.nature.com/articles/d41586-021-01968-y

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-07-22 10:271366
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.9 次阅读, 收获喜欢 1967 次。

关注

评论

发布
暂无评论
发现更多内容

为什么 Go 语言 struct 要使用 tags

AlwaysBeta

Go

从ChatGPT到AGI还有多远?| 社区征文

轻口味

ChatGPT

深度解析首个Layer3 链 Nautilus Chain,有何优势?

威廉META

字节一面:“为什么网络要分层?每一层的职责、包含哪些协议?”

做梦都在改BUG

Java 计算机网络 网络协议

深度解析首个Layer3 链 Nautilus Chain,有何优势?

西柚子

面试官:如何防止 Java 源码被反编译?我:有点懵

做梦都在改BUG

Java Java源码

死磕Spark事件总线——聊聊Spark中事件监听是如何实现的

做梦都在改BUG

Java 大数据 spark 事件监听

从设计角度,深入分析 Spring 循环依赖的解决思路

做梦都在改BUG

Java spring源码 循环依赖

应该升级 JDK 到 17 了吗

HoneyMoose

Matlab常用图像处理命令108例(一)

timerring

图像处理 数字图像处理

学会用规则引擎Drools,让你早点下班

JAVA旭阳

Java drools

Okhttp 的 retrofit2 运行警告信息异常

HoneyMoose

普通大专生,从面试无人问到拿下阿里offer!说说我的艰辛历程

做梦都在改BUG

Java 面试 专科

燃!网易架构大牛熬夜手敲千页网络协议笔记,竟在GitHub标星数万

做梦都在改BUG

Java 计算机网络 网络协议

云边端协同时序数据库的挑战与解决方案

CnosDB

时序数据库 开源社区 CnosDB 云边端协同

深度解析首个Layer3 链 Nautilus Chain,有何优势?

股市老人

IBM Semeru Windows 下的安装 JDK 17

HoneyMoose

Amazon GuardDuty 的新增功能 – Amazon EBS 卷的恶意软件检测

亚马逊云科技 (Amazon Web Services)

热点面试题:Vue2、3 生命周期及作用?

控心つcrazy

JavaScript 生命周期 Vue 3 vue2 前端面试题

BetterSnapTool for Mac 帮你整理窗口,提升效率

Rose

BetterSnapTool 窗口管理软件 mac软件下载

看完这一篇,ShardingSphere-jdbc 实战再也不怕了

勇哥java实战分享

OpenAI-J 如何进行测试

HoneyMoose

解决mac电脑打开应用“意外退出”的问题 (点按“重新打开”以再次打开应用程序)

Rose

意外退出 Mac软件

学会用规则引擎Drools,让你早点下班

小小怪下士

Java 程序员 后端 drools

在 Linux 上有哪些运行程序的方式?

黑客不够黑

Shell fork Linux 上启动程序 execv

全面项目管理软件:Project Office 激活版

真大的脸盆

项目管理 Mac Mac 软件 项目流程

深度解析首个Layer3 链 Nautilus Chain,有何优势?

EOSdreamer111

深度解析首个Layer3 链 Nautilus Chain,有何优势?

鳄鱼视界

苹果办公必备远程工具:Royal TSX使用教程

Rose

SSH Royal TSX 教程 Royal TSX 破解 Royal TSX mac下载

阿里内网开源:多位大佬联合撰写的Java多线程手册被我拿到了

做梦都在改BUG

Java 多线程

厉害了!刷完这份 532 算法秘笈后,我成功斩获字节、快手offer

做梦都在改BUG

Java 数据结构 面试 算法

成功破解困扰生物学界50年的蛋白质折叠难题,DeepMind的AlphaFold 2已宣布开源!_AI&大模型_Ewen Callaway_InfoQ精选文章