10 月,开发者不可错过的开源大数据大会-2021 WeDataSphere 社区大会深圳站 了解详情
写点什么

超算上百亿年找不到的答案,百度这个算法十分钟内找到了最优解

2021 年 10 月 14 日

超算上百亿年找不到的答案,百度这个算法十分钟内找到了最优解

作者 | 百度研究院

编辑 | 刘燕


疫情期间,mRNA疫苗以更高的安全性和有效性,更快的研发和生产速度被寄予厚望,成为疫情防控的重要武器,也是各国生命科学领域的关键竞争点。


虽然目前 mRNA 技术已被成功商业化,但全球的科研团队仍面临一个统一难题:mRNA 疫苗普遍稳定性低,致使它非常“脆弱”,很容易因为降解而失效,这成为 mRNA 疫苗研发过程中的巨大阻碍。


mRNA 的这种不稳定性给 mRNA 疫苗的存储、运输和免疫原性都带来了挑战,这些问题的解决与 mRNA 疫苗序列的设计息息相关。目前业内普遍认可的破解之道,就是设计出具有稳定结构且蛋白质翻译效率高的 mRNA 序列。


虽然找到了解决路径,但是要想破局并不容易。序列设计所需要的庞大的计算量,成为研发过程中最严峻的“拦路虎”。与新冠病毒刺突蛋白对应的 mRNA,若采用最传统的遍历方法去寻找一条稳定的序列,需要查看 10^632 次方个 mRNA 序列。


打个比方,假设一台超级计算机每秒计算一个序列,在宇宙诞生到现在的 138 亿年时间里,可能连潜在序列亿万分之一都无法搜索完成。


面对如此庞大的搜索空间,必须要有全新的算法,才能在有限的时间内寻找到那条最稳定有效的疫苗序列。


早在 2018 年,百度研究院就开展了 RNA 二级结构领域的研究。得益于这几年在生物计算领域的研究积累,在疫情之初,百度研究院做到了快速响应,并在 2020 年 4 月正式对外发布了LinearDesign mRNA序列优化算法


与依靠穷举法搜索稳定 mRNA 序列的思路不同,LinearDesign 通过动态规划算法,将序列稳定性和蛋白质翻译效率指标进行联合优化,可在 10 分钟内找到比天然序列更加稳定且蛋白质表达水平更高的新冠 mRNA 疫苗序列,实现了在最短时间内用最高的效率得出最优化的方案。


为了进一步验证 LinearDesign 算法的实际有效性,百度联合 mRNA 药物公司斯微生物进行了一系列实验研究。


本次实验研究基于 LinearDesign 算法设计的七条编码新冠病毒刺突蛋白的 mRNA 疫苗序列,对这些 mRNA 分子的稳定性、编码蛋白表达水平以及动物免疫原性等方面开展了深入研究,并与用传统方法设计的基准 mRNA 序列进行了头对头的对比。


近日,百度和斯微生物联合公布了 mRNA 疫苗序列设计算法 LinearDesign 的新冠病毒疫苗生物实验结果: 在稳定性、蛋白质表达水平以及免疫原性等多个衡量疫苗的重要指标上,LinearDesign 设计的新冠疫苗序列均大幅优于传统方法设计的基准序列,尤其在抗原中和抗体滴度这一衡量疫苗有效性的关键指标上,LinearDesign 设计的序列最高超过基准序列达到 20 倍,表示 LinearDesign 设计的疫苗能够有效产生免疫保护;其实际有效性和应用于生物制药领域的价值被充分验证。



百度 LinearDesign 算法设计的七条疫苗序列(A-G)以及基准序列(H)等相关信息


百度 LinearDesign 算法从理论层面和生物学实验层面得到有效性验证,为将 AI 应用于生命科学探索出一条实际可行的道路。


LinearDesign 算法也进一步验证了AI+制药的价值。这项技术还具有广泛的适用性,除了应用于新冠病毒 mRNA 疫苗的研发,还能包括传染病疫苗、肿瘤疫苗、单抗等各种疫苗和药物的研发,也进一步验证了人工智能、生物计算技术在生命科学领域的实际应用价值。


以 LinearDesign 算法为代表的生物计算技术,将大大缩短新药研发的周期、降低研发成本,并能提高医疗诊断的准确性和效率。

2021 年 10 月 14 日 14:461550
用户头像
刘燕 InfoQ记者

发布了 696 篇内容, 共 223.6 次阅读, 收获喜欢 1339 次。

关注

评论 4 条评论

发布
用户头像
1232311
2021 年 10 月 15 日 11:52
回复
d d d d s s s
2021 年 10 月 15 日 11:59
回复
sdasd
2021 年 10 月 15 日 11:59
回复
asdas
2021 年 10 月 15 日 11:59
回复
没有更多了
发现更多内容

无所不能 就像妈妈一样

Neco.W

思考 情绪

C++中glog源码剖析以及如何设计一个高效 log模块

helloworld

c c++ C#

每日算法之leetcode 50 Power

田镇珲

递归 LeetCode 分治

Java 环境配置与编辑器使用

旭霁

Java IDEA

高仿瑞幸小程序 04 小程序的全局数据

曾伟@喵先森

小程序 微信小程序 前端

电脑城最简单骗局,仍然有无数人上当

周三不加班

电脑城 电脑选购

Web百度离线地图开发

玏佾

WebGIS 离线地图 Web离线地图

自助设备系列——增长点

孙苏勇

产品 行业资讯 智能设备

DDD 实践手册(5. Factory 与 Repository)

Joshua

企业架构 设计模式 领域驱动设计 DDD 架构模式

数据湖引擎是什么鬼

数据社

大数据 数据仓库 数据湖 数据架构

时间足够爱你

rmrf

学习 思考 持之以恒

以不变应万变——复杂系统回归测试新思路

刘华Kenneth

DevOps 敏捷 测试 单体系统 复杂

程序员《后浪》-图文版

Java_若依框架教程

后浪 程序媛 娱乐

C++ sqlite3使用指南

helloworld

c c++ C#

拜托,别再问我Zookeeper如何实现分布式锁了!

不才陈某

zookeeper 分布式 后端 分布式锁

使用人工智能技术改进面试机器人

陆道峰

人工智能 学习 聊天机器人

架构师快问快答2

IT民工大叔

Netty 源码解析(八): 回到 Channel 的 register 操作

猿灯塔

腊鸡与猴儿

黄大路

人生 小说

想看懂stl代码,先搞定type_traits是关键

helloworld

c c++ C#

深入浅出虚拟内存

helloworld

c c++ C#

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (三)单元测试在整个测试体系中的位置

编程道与术

软件测试 TDD 单元测试 集成测试 验收测试

一个 UED 团队的自我修养

oldj

团队管理 UED

程序员• 后浪

古时的风筝

程序员 后浪

Java并发编程--ReentrantLock

Java收录阁

并发编程

关于职能型团队管理一些总结

黄大路

项目管理 管理

MacOS高效使用指南-我的体系化方案以及软件清单

lmymirror

高效工作 效率工具 知识管理 Mac 操作系统

直播电商行业一些看法

黄大路

互联网 商业 商业模式 商业价值 行业资讯

Java并发编程基础--Java内存模型

Java收录阁

作为自由职业者,我的近况

一尘观世界

程序员 自由职业 复盘

读 Go Scheduler 有感:给产品经理的建议

Ya

程序员 产品经理 操作系统 OS Scheduler

开源中间件技术学习路线

开源中间件技术学习路线

超算上百亿年找不到的答案,百度这个算法十分钟内找到了最优解-InfoQ