【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

AI 可以是药神

  • 2020-06-02
  • 本文字数:5973 字

    阅读完需:约 20 分钟

AI可以是药神

新药研发是一场“马拉松”,AI 能让它实现弯道超车吗?

AI 加速新药研发翻过三座大山

长研发周期,高研发成本,低成功率是新药研发的“三座大山”。


一款新药从开始研发到获批准上市,需要 10-15 年的时间,平均耗费约 26 亿美元,临床成功率不到 10%,这意味着有 90% 以上的药物会在临床阶段被淘汰。


早年,强生副董事长兼首席科学官 Paul Stoffels 曾形容,一款新药的研发上市要难于制造飞机。


解决传统制药行业普遍的难题,AI 或许是一把好的钥匙。


新药研发要经历药物作用靶点确认、先导化合物确定、临床前候选药物选定、临床前研究、临床等多个阶段。晶泰科技首席科学家张佩宇在接受 InfoQ 采访时表示,从靶点确定到临床候选药物环节,利用传统方法,大概需要 4-6 年时间才能获得想要的分子,而通过 AI+计算的方法可以将时间缩短到 1-2 年。


另据 TechEmergence 的一份报告显示,AI 可以将新药研发的成功率从 12%提高到 14%,能够为生物制药行业节省数十亿美元研发费用。


晶泰科技是国内最早将 AI 用于辅助制药的公司之一,2017 年,国内 AI 药物发现领域还几乎是一片空白,创业公司也寥寥无几,而成立 3 年的晶泰科技已在该领域有所探索和布局。其主要涉足药物发现和晶型研究,聚焦于利用 AI、量子物理、计算化学、云计算等技术,提升药物研究的效率和成功率。



成立 5 年来,晶泰曾先后获得来自谷歌、腾讯、红杉中国、晨兴资本等顶级投资机构的融资,是目前全球 AI 药物研发领域融资额度最高的公司之一。


它的成长历程无疑是市场和资本对于这个领域投注更多目光的见证和缩影。据汇众研究院不完全统计,截止 2019 年 3 月,目前全球 AI 药物研发创业公司有 163 家(其中国内仅 14 家)。而 2 年之前这个数字不足 30 家。截止 2019 年 3 月,国内外共 140 多家 AI+新药研发公司获得融资,累计交易次数为 342 起,获得融资总额为 483 亿美元,超过了 2017 年全年的融资总额(约 190 亿美元)。



全球药物发现与开发领域的顶级 AI 公司与制药、科技公司之间的互联网络。图源:Forbes.com,作者: Yiannis Mouratidis 


去年 5 月,全球首款 AI 设计药物 —“涡轮增压”流感疫苗的问世,更是让人们看到了 AI 在药物发现中的潜力,或许未来,AI 将创造新的药物研发模式。

在 10 的 60 次方空间搜索有效药物分子

张佩宇表示,与传统的药物研发过程相比,AI 能够极大的起到降本增效的作用。


“新药研发其实有一定的碰运气成分,因此,如果探索的化学空间不够广泛多样,很可能就错失了机会”。


2017 年,《Nature》的一篇文章曾提到一个很有意思的数据,在整个药物分子的化学空间里,可存在的药物分子的数量大概是 10 的 60 次方那么多。这个数量超过了太阳系中所有原子的数(10 的 50 次方)。但目前,实验方法是不可能将这些分子全都合成出来的,现有的类药分子数据库能接触到的分子数仅约有 10 的 11 次方左右。


传统的药物研发更多以药化专家为主导,由药化专家想出几十个分子去做计算辅助。早期的药物研发是一门艺术,因为如果换了专家,分子也便不同。但通过 AI 可以产生大量分子,规模高达百万、千万量级。因此,在分子产生环节,AI 可以覆盖更全面的化学空间。



“医药研发失败率很高,每 5000~10000 个进入研发管线的分子当中,只有一个才能真正上市。因此当第一次合成后,要不断迭代和筛选。这个过程呈现‘漏斗’形状,越能够高效地找到合适的分子,就表示药物研发效率越高。否则,很有可能就是在反反复复做实验,很多年才能找到一个真正能够往前推进的真正有潜力的候选药物分子”。


张佩宇告诉 InfoQ,晶泰科技利用最新的 AI 算法来助力分子设计中的筛选过程。相较于使用传统的计算方法,可以有效地提升获得优良性质的分子的比例——即富集率——至 8-10 倍,从而大大地降低实验筛选的时间和成本。


在评估环节,因为分子较少,传统方式会采用一些较粗略的方法进行评估后做实验。而晶泰科技的智能药物研发平台可以采用高精度的方法进行快速、全面的评估,从几百万个候选分子逐步聚焦到很少的数量,然后由药化专家去做最终的合成难度评估,选择 10 个左右的分子去做实验验证、迭代。


“效率,永远是传统实验的一个瓶颈”。现阶段的人工智能药物研发过程,分子的产生、设计、评估,还很大程度上依靠科学家干预。张佩宇希望下一步可以实现全自动设计、自动合成,甚至在未来实现自动检测和迭代。他透露,晶泰科技正在进行一些提高实验效率的探索,从而进一步提升药物研发的效率。

从晶型预测到新药发现

晶型预测是晶泰科技的起家业务。2014 年,温书豪、马健、赖力鹏三位量子物理学家在麻省理工学院的校园里创办了晶泰科技。他们认为,晶型预测和晶型结构确定本质上是一个物理问题,可以通过更加精确、快速的 AI+ 物理和云计算的方法来解决。


晶体结构研究是化合物研究的一大重点,是分子从实验室里的药物有效成分向货架上的药物产品转变的关键一步。化合物具有能够形成不同晶体结构的特点(多晶型现象)。化合物本身的关键理化性质,如密度、外观形态、溶解度、溶解速率等部分地由其晶体结构决定。对于药品,晶体结构可以显著影响药物的生物利用度,最终影响药物的治疗表现。


晶型的稳定性对进行药物研究至关重要,它关系着药物的质量与安全性。如果稳定性不好,药物可能会在临床阶段或者上市阶段产生晶型转变,造成关键性质的变化,导致召回或需要重做部分或全部的临床研究,这意味着巨大的时间成本和金钱损失。


晶型预测是一个很难的问题。传统的研发中,研究人员通过设置不同的结晶条件进行结晶实验,但很难通过实验试错在短时间内获得所有晶型,或确定已获得的就是最稳定的晶型。而高精度量子力学计算、结合 AI 的方法可以产生大量可能的晶型结构并迭代、优化,最终锁定性质最稳定、最适合用于药物研发的晶型,或盐型、共晶、水合物,在实现全面性的搜索、维持计算的高精确度的同时,显著节省计算成本与时间,协助科研人员利用有限的实验结果,作出关键的研发决策,为药企解决药物固态研发一大痛点。



晶泰科技的晶型预测等药物固态研发服务


晶泰科技创立早期将大量的精力铺在了晶型的搜索以及稳定性研究上。张佩宇回忆,早期团队在攻克复杂的晶体结构体系算法上遇到了很大的难题,预测不出来,结构怎么算都不对。“那段时间大家心情比较低落,因为如果我们只能做简单的体系,做不了特别复杂的,能做的项目就比较少,适用性和对药物工业的实用意义都大打折扣”。


团队最终决定展开技术攻关。一个最直接的变化是,持续性加班的日子变多了,“那段时间每天搞到早上四五点”,张佩宇说,“不过也挺有意思,每天早上起来去测一个更复杂的体系,然后调整计算,算到半夜两三点觉得好像调的差不多了,然后提交,第二天早上再来看结果,如此循环往复”。


功夫不负有心人,通过持续改进,晶泰团队的晶型预测能力终取得突破,从最开始的只能做简单的体系,到能够做五六十个自由度的复杂体系,最后算法成型,实现了盐型、共晶、水合物和溶剂合物都能快速、成功预测的技术突破。


这也成为晶泰科技后来的核心竞争力之一。现在,药物的复杂度提升对药物的晶型预测提出了更高的要求。张佩宇表示,晶泰科技的晶型预测的成功率达到 100%,而国外的一些组织目前仍只能针对简单体系做预测。


高准确率背后得益于较强的算力资源保障。晶泰科技的算法部署在亚马逊、腾讯、阿里、谷歌等厂商的云上,可调动起 100 万个计算核心,因此可以做到短时间内预测,能够在大概 2 周左右出预测结果。这相对于传统实验所需时间(几个月-数年)显著缩短,也保障了精确度和成功率。


晶泰科技持续研发与创新,将其技术优势拓展到上下游的研发阶段当中。据介绍,晶泰团队最近基于一种叫 FEP(自由能微扰)的高精度预测流程进行了全新的改良,这是新药发现中最高精度的计算蛋白和药物分子相互作用的方法。晶泰科技的 XFEP 方法能够将 AI 和量子物理计算结合起来,更好的评估活性分子与靶点的亲和力,从而将活性不好的分子提前筛选出来并淘汰。晶泰科技的云端平台可以调动上千个 GPU,在一天内可做几千个 FEP 计算,能迅速评估大量分子,缩短对分子评估的时间周期,提高实验筛选的针对性和效率。



药物设计中用自由能微扰计算(FEP)流程获得不同分子设计与同一靶标的结合自由能差,评估活性


值得一提的是,FEP 等高精度计算方法能够为制药 AI 的一个关键问题——数据短缺提供新的出路。通过高精度算法可以产生大量的高精度数据,这些虚拟数据可以用来做 AI 建模,之后再去评估想要的分子。实验数据难获得且昂贵,虚拟数据是其有效补充。除虚拟数据,晶泰也拥有自建的实验数据库。


最近几年,晶泰科技开始不断加大对新药的设计与研发业务的布局,主做小分子药物设计,同时也有抗体研发设计和多肽研发设计。该业务一方面是与美国 MIT、哈佛等顶尖科研机构的生物学家合作推新药管线,前者选定靶点,晶泰科技通过其 AI 平台找合适的化合物、候选药物以推进临床前研究。另一方面,晶泰科技也为国内药企服务,加速其研发的内部管线。



晶泰科技药物设计服务流程


据了解,2017 年 7 月,晶泰科技曾免费推出面向有科研和数据处理需求的单位的人工智能模型训练平台 AtomPai,预搭载了几十种常用算法模型与自动的数据可视化功能。而针对药物工业,晶泰科技的智能药物研发平台–ID4 平台涵盖了从药物发现、药物晶型(固态)研发等方向的众多工具和几十种药物性质预测算法,可用于药物研发多个关键环节的核心问题。该平台分为 4 层,算力资源、调度平台、算法平台,以及通用力场、XFEP 等工具和解决方案。


ID4 平台主要优势在于预见性预测,在早期更全面地评估所有潜在的药物分子的物理、化学、药学性质,优先推进性质更理想、更有可能成功的分子,把大批难以成功开发或者有重大性质缺陷的分子提早筛选下去。“ID4 用精确的算法在早期综合评估分析分子候选,用人工智能和算法的先见之明去解决药物研发的一些后顾之忧”。

忍痛推倒重来 98%成功率的算法

与其他 AI 药物研发创业公司相比,晶泰科技的技术商业化落地进程开始的比较早。这要从 2016 年晶泰与全球最大的生物制药公司辉瑞的一次结缘说起。


当时辉瑞组织了一次晶型预测盲测。用从未对外公布过的不同难度的分子,对学界和市面上所有的解决方案进行横向评估。张佩宇回忆,团队用了 2 个月时间完成了盲测预测。忐忑的心情一直持续到 12 月份,结果终于出来了,晶泰团队预测的晶型 100%匹配。



晶泰科技帮助药物研发科学家预测并优化某候选药物分子的最优晶型。作者:JOSEPH F. KRZYZANIAK。来源:辉瑞网站 breakthroughs.com ,文章《How Quantum Physics and AI is Disrupting Drug Discovery & Development》"


当时晶泰仅是一个成立 2 年的小团队,从诸多晶型预测团队中脱颖而出。现在回忆起来,整个盲测的过程,张佩宇还历历在目,他将这看作自己和团队的一个高光时刻。


这次盲测成功标志着晶泰的商业化走出的重要一步,在此之前,团队一直全身心铺在研发上,与药企只有几个有限规模的合作项目。后来,双方达成战略合作,晶泰科技不仅为辉瑞提供晶型预测的技术服务,还为其新药发现搭建小分子药物模拟算法平台。辉瑞在其网站撰文为晶泰科技做介绍时说,晶泰科技的技术已经改变了辉瑞制药的方法,并有潜力改变药物工业。


最近几年,传统大型药企和 AI 公司合作成为了一大趋势,不止辉瑞,默沙东、葛兰素史克等药企也和 AI 公司合作紧密。AI 能够快速找到新的靶点,更快找到适合的候选分子并预测晶型等药物开发的关键研究问题,从而提高研发效率,这是 AI 公司受到传统药企青睐的原因。


不过和大药企合作并不像想象中那么简单,它们普遍对于 AI 公司的技术实力要求极高,且对于细节把控严格。


一个难点在于 AI 如何自证价值。张佩宇认为,需要正视一个新技术走向落地是需要一个过程的,有些药企会觉得传统的方式可以做药,为什么一定要用 AI 平台?


“现在大家都在早期阶段,走的最快的‘AI+ 算法’研发药物也仍在临床试验阶段,如何走一条没有人走过的路,并能够跟客户证明,虽然算法作用于研发早期,但你能直接看到效果验证,且在中期甚至临床都能使项目收益,这就需要持续的市场培育和信心构建”。


另一个考验在于如何在工程和技术间取得平衡。这里面经历了一段痛苦的磨合过程。张佩宇对一个预测算法开发的项目印象很深刻。当时这个项目做到 95%-98%的准确度花了很多时间很多人力物力,再提升却停滞不前,项目陷入了瓶颈。


往前走走不下去,止步于此又不甘心。团队面临着两难选择。最后团队还是决定“痛下杀手”,将算法推倒重来,从底层的结构重新去改原本的算法。


“这真的是需要下很大的决心,因为从 98%到 100% ,它的修改已经不是小的改进,而是需要一定魄力的,前面已经投入了众多资源,再投入成本是否 hold 住,管理层需要从投入-产出上作综合评估。但我们还是更希望突破技术壁垒,将复杂的分子算到 100%精确”。


最终,团队想出了新方案,又加入了一些新的模型和新算法,项目取得了成功。


张佩宇觉得有一个能打的团队和算法实力对一家年轻的公司来说格外重要,当遇到困难时,需要有敢于破局重来的勇气。这份执着让晶泰的商业化之路走的更顺畅,“TO B 的业务一开始门槛很高,但只要你跟对方合作起来,别人对你产生了认可,会一步步将更多的产品和服务应用起来”。

结 语

现阶段,AI 药物研发仍处在较早期的阶段,不论是在技术创新还是应用落地上还存在着比较大的挑战,例如体外和体内的相关性问题以及动物模型和临床相关性的问题等。


不过前景可期。最近几年,AI 在药物研发领域的存在感越来越高,尤其 2020 年开年以来猝然爆发的新冠疫情也让 AI+新药研发博得了众多关注,当一场类似的大流行病袭来时,药物研发的速度就成为和生命赛跑的关键。


鉴于 AI 在疫情防控中所发挥的积极作用,今年 4 月,科技部表示将支持研究人工智能技术在传染病防治、药物研发等方面的应用。政策性利好之下,AI+药物研发或将迎来一个新的风口。


可以预见的是,AI 技术的应用,将在加速整个药物研发的进程中发挥着越来越重要的作用。AI 究竟能够为药物研发带来怎样的可能性,期待时间来验证。

采访嘉宾介绍

张佩宇博士,晶泰科技首席科学家,主导研发晶泰科技 ID4 人工智能药物创制平台。张佩宇是中科院博士,曾任大连化物所副研究员,有十余年计算化学算法开发经验,在国内外重要刊物上发表研究论文 30 余篇。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-06-02 17:068261
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.1 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

SQL INSERT INTO 语句详解:插入新记录、多行插入和自增字段

小万哥

MySQL 数据库 sql 程序员 后端开发

Amazon EC2的出现,是时代的选择了它,还是它选择了时代

淼.

Mate Translate for Mac(翻译软件) v8.1.3激活特别版

mac

翻译软件 苹果mac Windows软件 Mate Translate

Modern CSV for mac(适用于Mac的CSV文件编辑器)

iMac小白

目前为止BRC-20是炒作还是泡沫

币离海

BRC-20 铭文

Topaz Photo AI for Mac(图像处理AI软件) 2.1.2激活版

iMac小白

基于FX构建大型Golang应用

俞凡

golang 架构

Rhino 8 for Mac「犀牛 3D建模工具」

繁星

犀牛3D建模软件 3d建模 Rhino 8

iTubeGo for Mac(网页视频下载软件)完美激活版

mac

视频下载工具 苹果mac Windows软件 iTubeGo

ON1 Photo RAW 2024 for Mac(照片编辑器)中文版

影影绰绰一往直前

专业核磁数据处理软件MestReNova 14破解版

iMac小白

高性价比的轻量应用服务器

Hanson

「Macos排版神器」Affinity Publisher for Mac中文直装版

彩云

Affinity Publisher

Jenkins 打包shell出现gradle命令不存在,jvm内存溢出

javaNice

Java jenkins

Kubernetes成本优化

俞凡

Kubernetes

Rocket Typist pro for mac(文本快速输入工具)v3.0.8激活版

影影绰绰一往直前

文心一言 VS 讯飞星火 VS chatgpt (138)-- 算法导论11.4 2题

福大大架构师每日一题

福大大架构师每日一题

Coherence X for Mac「网站转换为Mac应用」

彩云

Coherence X

Charles for Mac中文破解版下载

影影绰绰一往直前

iShowU Studio 2 for mac(屏幕录像编辑工具)v2.3.12注册激活版

影影绰绰一往直前

JProfiler 14 序列号激活 附 完整安装教程

繁星

JAVA开发 JProfiler 14

ClickCharts for Mac(轻量级思维导图软件)v8.67激活版

影影绰绰一往直前

Topaz DeNoise AI for Mac(图片降噪软件) v3.7.2完美激活版

mac

苹果mac Windows软件 图片降噪软件 Topaz DeNoise AI

jdk8 Stream流中将集合转成map,重复key处理,统计最大值,获取某个属性集合等10种最常用方法

javaNice

Java stream

DAPP代币燃烧铸币质押挖矿系统开发(源码搭建)

l8l259l3365

menubarx for mac(强大的菜单栏浏览器工具)v1.6.5直装版

影影绰绰一往直前

MacOS数据库:Navicat Premium 15 for Mac中文破解版

影影绰绰一往直前

亚马逊Lightsail:云服务新篇章,轻松开启您的数字未来

熬夜磕代码、

亚马逊云 AWS Lightsail

SQL 的 AND、OR 和 NOT 运算符:条件筛选的高级用法

小万哥

MySQL sql 程序员 后端 开发

Coherence X for mac(将网站转变为Mac应用程序)v4.5.2激活版

影影绰绰一往直前

Redis缓存雪崩、击穿、穿透解释及解决方法,缓存预热,布隆过滤器 ,互斥锁

javaNice

Java redis

AI可以是药神_AI&大模型_刘燕_InfoQ精选文章