写点什么

AI 可以是药神

  • 2020-06-02
  • 本文字数:5973 字

    阅读完需:约 20 分钟

AI可以是药神

新药研发是一场“马拉松”,AI 能让它实现弯道超车吗?

AI 加速新药研发翻过三座大山

长研发周期,高研发成本,低成功率是新药研发的“三座大山”。


一款新药从开始研发到获批准上市,需要 10-15 年的时间,平均耗费约 26 亿美元,临床成功率不到 10%,这意味着有 90% 以上的药物会在临床阶段被淘汰。


早年,强生副董事长兼首席科学官 Paul Stoffels 曾形容,一款新药的研发上市要难于制造飞机。


解决传统制药行业普遍的难题,AI 或许是一把好的钥匙。


新药研发要经历药物作用靶点确认、先导化合物确定、临床前候选药物选定、临床前研究、临床等多个阶段。晶泰科技首席科学家张佩宇在接受 InfoQ 采访时表示,从靶点确定到临床候选药物环节,利用传统方法,大概需要 4-6 年时间才能获得想要的分子,而通过 AI+计算的方法可以将时间缩短到 1-2 年。


另据 TechEmergence 的一份报告显示,AI 可以将新药研发的成功率从 12%提高到 14%,能够为生物制药行业节省数十亿美元研发费用。


晶泰科技是国内最早将 AI 用于辅助制药的公司之一,2017 年,国内 AI 药物发现领域还几乎是一片空白,创业公司也寥寥无几,而成立 3 年的晶泰科技已在该领域有所探索和布局。其主要涉足药物发现和晶型研究,聚焦于利用 AI、量子物理、计算化学、云计算等技术,提升药物研究的效率和成功率。



成立 5 年来,晶泰曾先后获得来自谷歌、腾讯、红杉中国、晨兴资本等顶级投资机构的融资,是目前全球 AI 药物研发领域融资额度最高的公司之一。


它的成长历程无疑是市场和资本对于这个领域投注更多目光的见证和缩影。据汇众研究院不完全统计,截止 2019 年 3 月,目前全球 AI 药物研发创业公司有 163 家(其中国内仅 14 家)。而 2 年之前这个数字不足 30 家。截止 2019 年 3 月,国内外共 140 多家 AI+新药研发公司获得融资,累计交易次数为 342 起,获得融资总额为 483 亿美元,超过了 2017 年全年的融资总额(约 190 亿美元)。



全球药物发现与开发领域的顶级 AI 公司与制药、科技公司之间的互联网络。图源:Forbes.com,作者: Yiannis Mouratidis 


去年 5 月,全球首款 AI 设计药物 —“涡轮增压”流感疫苗的问世,更是让人们看到了 AI 在药物发现中的潜力,或许未来,AI 将创造新的药物研发模式。

在 10 的 60 次方空间搜索有效药物分子

张佩宇表示,与传统的药物研发过程相比,AI 能够极大的起到降本增效的作用。


“新药研发其实有一定的碰运气成分,因此,如果探索的化学空间不够广泛多样,很可能就错失了机会”。


2017 年,《Nature》的一篇文章曾提到一个很有意思的数据,在整个药物分子的化学空间里,可存在的药物分子的数量大概是 10 的 60 次方那么多。这个数量超过了太阳系中所有原子的数(10 的 50 次方)。但目前,实验方法是不可能将这些分子全都合成出来的,现有的类药分子数据库能接触到的分子数仅约有 10 的 11 次方左右。


传统的药物研发更多以药化专家为主导,由药化专家想出几十个分子去做计算辅助。早期的药物研发是一门艺术,因为如果换了专家,分子也便不同。但通过 AI 可以产生大量分子,规模高达百万、千万量级。因此,在分子产生环节,AI 可以覆盖更全面的化学空间。



“医药研发失败率很高,每 5000~10000 个进入研发管线的分子当中,只有一个才能真正上市。因此当第一次合成后,要不断迭代和筛选。这个过程呈现‘漏斗’形状,越能够高效地找到合适的分子,就表示药物研发效率越高。否则,很有可能就是在反反复复做实验,很多年才能找到一个真正能够往前推进的真正有潜力的候选药物分子”。


张佩宇告诉 InfoQ,晶泰科技利用最新的 AI 算法来助力分子设计中的筛选过程。相较于使用传统的计算方法,可以有效地提升获得优良性质的分子的比例——即富集率——至 8-10 倍,从而大大地降低实验筛选的时间和成本。


在评估环节,因为分子较少,传统方式会采用一些较粗略的方法进行评估后做实验。而晶泰科技的智能药物研发平台可以采用高精度的方法进行快速、全面的评估,从几百万个候选分子逐步聚焦到很少的数量,然后由药化专家去做最终的合成难度评估,选择 10 个左右的分子去做实验验证、迭代。


“效率,永远是传统实验的一个瓶颈”。现阶段的人工智能药物研发过程,分子的产生、设计、评估,还很大程度上依靠科学家干预。张佩宇希望下一步可以实现全自动设计、自动合成,甚至在未来实现自动检测和迭代。他透露,晶泰科技正在进行一些提高实验效率的探索,从而进一步提升药物研发的效率。

从晶型预测到新药发现

晶型预测是晶泰科技的起家业务。2014 年,温书豪、马健、赖力鹏三位量子物理学家在麻省理工学院的校园里创办了晶泰科技。他们认为,晶型预测和晶型结构确定本质上是一个物理问题,可以通过更加精确、快速的 AI+ 物理和云计算的方法来解决。


晶体结构研究是化合物研究的一大重点,是分子从实验室里的药物有效成分向货架上的药物产品转变的关键一步。化合物具有能够形成不同晶体结构的特点(多晶型现象)。化合物本身的关键理化性质,如密度、外观形态、溶解度、溶解速率等部分地由其晶体结构决定。对于药品,晶体结构可以显著影响药物的生物利用度,最终影响药物的治疗表现。


晶型的稳定性对进行药物研究至关重要,它关系着药物的质量与安全性。如果稳定性不好,药物可能会在临床阶段或者上市阶段产生晶型转变,造成关键性质的变化,导致召回或需要重做部分或全部的临床研究,这意味着巨大的时间成本和金钱损失。


晶型预测是一个很难的问题。传统的研发中,研究人员通过设置不同的结晶条件进行结晶实验,但很难通过实验试错在短时间内获得所有晶型,或确定已获得的就是最稳定的晶型。而高精度量子力学计算、结合 AI 的方法可以产生大量可能的晶型结构并迭代、优化,最终锁定性质最稳定、最适合用于药物研发的晶型,或盐型、共晶、水合物,在实现全面性的搜索、维持计算的高精确度的同时,显著节省计算成本与时间,协助科研人员利用有限的实验结果,作出关键的研发决策,为药企解决药物固态研发一大痛点。



晶泰科技的晶型预测等药物固态研发服务


晶泰科技创立早期将大量的精力铺在了晶型的搜索以及稳定性研究上。张佩宇回忆,早期团队在攻克复杂的晶体结构体系算法上遇到了很大的难题,预测不出来,结构怎么算都不对。“那段时间大家心情比较低落,因为如果我们只能做简单的体系,做不了特别复杂的,能做的项目就比较少,适用性和对药物工业的实用意义都大打折扣”。


团队最终决定展开技术攻关。一个最直接的变化是,持续性加班的日子变多了,“那段时间每天搞到早上四五点”,张佩宇说,“不过也挺有意思,每天早上起来去测一个更复杂的体系,然后调整计算,算到半夜两三点觉得好像调的差不多了,然后提交,第二天早上再来看结果,如此循环往复”。


功夫不负有心人,通过持续改进,晶泰团队的晶型预测能力终取得突破,从最开始的只能做简单的体系,到能够做五六十个自由度的复杂体系,最后算法成型,实现了盐型、共晶、水合物和溶剂合物都能快速、成功预测的技术突破。


这也成为晶泰科技后来的核心竞争力之一。现在,药物的复杂度提升对药物的晶型预测提出了更高的要求。张佩宇表示,晶泰科技的晶型预测的成功率达到 100%,而国外的一些组织目前仍只能针对简单体系做预测。


高准确率背后得益于较强的算力资源保障。晶泰科技的算法部署在亚马逊、腾讯、阿里、谷歌等厂商的云上,可调动起 100 万个计算核心,因此可以做到短时间内预测,能够在大概 2 周左右出预测结果。这相对于传统实验所需时间(几个月-数年)显著缩短,也保障了精确度和成功率。


晶泰科技持续研发与创新,将其技术优势拓展到上下游的研发阶段当中。据介绍,晶泰团队最近基于一种叫 FEP(自由能微扰)的高精度预测流程进行了全新的改良,这是新药发现中最高精度的计算蛋白和药物分子相互作用的方法。晶泰科技的 XFEP 方法能够将 AI 和量子物理计算结合起来,更好的评估活性分子与靶点的亲和力,从而将活性不好的分子提前筛选出来并淘汰。晶泰科技的云端平台可以调动上千个 GPU,在一天内可做几千个 FEP 计算,能迅速评估大量分子,缩短对分子评估的时间周期,提高实验筛选的针对性和效率。



药物设计中用自由能微扰计算(FEP)流程获得不同分子设计与同一靶标的结合自由能差,评估活性


值得一提的是,FEP 等高精度计算方法能够为制药 AI 的一个关键问题——数据短缺提供新的出路。通过高精度算法可以产生大量的高精度数据,这些虚拟数据可以用来做 AI 建模,之后再去评估想要的分子。实验数据难获得且昂贵,虚拟数据是其有效补充。除虚拟数据,晶泰也拥有自建的实验数据库。


最近几年,晶泰科技开始不断加大对新药的设计与研发业务的布局,主做小分子药物设计,同时也有抗体研发设计和多肽研发设计。该业务一方面是与美国 MIT、哈佛等顶尖科研机构的生物学家合作推新药管线,前者选定靶点,晶泰科技通过其 AI 平台找合适的化合物、候选药物以推进临床前研究。另一方面,晶泰科技也为国内药企服务,加速其研发的内部管线。



晶泰科技药物设计服务流程


据了解,2017 年 7 月,晶泰科技曾免费推出面向有科研和数据处理需求的单位的人工智能模型训练平台 AtomPai,预搭载了几十种常用算法模型与自动的数据可视化功能。而针对药物工业,晶泰科技的智能药物研发平台–ID4 平台涵盖了从药物发现、药物晶型(固态)研发等方向的众多工具和几十种药物性质预测算法,可用于药物研发多个关键环节的核心问题。该平台分为 4 层,算力资源、调度平台、算法平台,以及通用力场、XFEP 等工具和解决方案。


ID4 平台主要优势在于预见性预测,在早期更全面地评估所有潜在的药物分子的物理、化学、药学性质,优先推进性质更理想、更有可能成功的分子,把大批难以成功开发或者有重大性质缺陷的分子提早筛选下去。“ID4 用精确的算法在早期综合评估分析分子候选,用人工智能和算法的先见之明去解决药物研发的一些后顾之忧”。

忍痛推倒重来 98%成功率的算法

与其他 AI 药物研发创业公司相比,晶泰科技的技术商业化落地进程开始的比较早。这要从 2016 年晶泰与全球最大的生物制药公司辉瑞的一次结缘说起。


当时辉瑞组织了一次晶型预测盲测。用从未对外公布过的不同难度的分子,对学界和市面上所有的解决方案进行横向评估。张佩宇回忆,团队用了 2 个月时间完成了盲测预测。忐忑的心情一直持续到 12 月份,结果终于出来了,晶泰团队预测的晶型 100%匹配。



晶泰科技帮助药物研发科学家预测并优化某候选药物分子的最优晶型。作者:JOSEPH F. KRZYZANIAK。来源:辉瑞网站 breakthroughs.com ,文章《How Quantum Physics and AI is Disrupting Drug Discovery & Development》"


当时晶泰仅是一个成立 2 年的小团队,从诸多晶型预测团队中脱颖而出。现在回忆起来,整个盲测的过程,张佩宇还历历在目,他将这看作自己和团队的一个高光时刻。


这次盲测成功标志着晶泰的商业化走出的重要一步,在此之前,团队一直全身心铺在研发上,与药企只有几个有限规模的合作项目。后来,双方达成战略合作,晶泰科技不仅为辉瑞提供晶型预测的技术服务,还为其新药发现搭建小分子药物模拟算法平台。辉瑞在其网站撰文为晶泰科技做介绍时说,晶泰科技的技术已经改变了辉瑞制药的方法,并有潜力改变药物工业。


最近几年,传统大型药企和 AI 公司合作成为了一大趋势,不止辉瑞,默沙东、葛兰素史克等药企也和 AI 公司合作紧密。AI 能够快速找到新的靶点,更快找到适合的候选分子并预测晶型等药物开发的关键研究问题,从而提高研发效率,这是 AI 公司受到传统药企青睐的原因。


不过和大药企合作并不像想象中那么简单,它们普遍对于 AI 公司的技术实力要求极高,且对于细节把控严格。


一个难点在于 AI 如何自证价值。张佩宇认为,需要正视一个新技术走向落地是需要一个过程的,有些药企会觉得传统的方式可以做药,为什么一定要用 AI 平台?


“现在大家都在早期阶段,走的最快的‘AI+ 算法’研发药物也仍在临床试验阶段,如何走一条没有人走过的路,并能够跟客户证明,虽然算法作用于研发早期,但你能直接看到效果验证,且在中期甚至临床都能使项目收益,这就需要持续的市场培育和信心构建”。


另一个考验在于如何在工程和技术间取得平衡。这里面经历了一段痛苦的磨合过程。张佩宇对一个预测算法开发的项目印象很深刻。当时这个项目做到 95%-98%的准确度花了很多时间很多人力物力,再提升却停滞不前,项目陷入了瓶颈。


往前走走不下去,止步于此又不甘心。团队面临着两难选择。最后团队还是决定“痛下杀手”,将算法推倒重来,从底层的结构重新去改原本的算法。


“这真的是需要下很大的决心,因为从 98%到 100% ,它的修改已经不是小的改进,而是需要一定魄力的,前面已经投入了众多资源,再投入成本是否 hold 住,管理层需要从投入-产出上作综合评估。但我们还是更希望突破技术壁垒,将复杂的分子算到 100%精确”。


最终,团队想出了新方案,又加入了一些新的模型和新算法,项目取得了成功。


张佩宇觉得有一个能打的团队和算法实力对一家年轻的公司来说格外重要,当遇到困难时,需要有敢于破局重来的勇气。这份执着让晶泰的商业化之路走的更顺畅,“TO B 的业务一开始门槛很高,但只要你跟对方合作起来,别人对你产生了认可,会一步步将更多的产品和服务应用起来”。

结 语

现阶段,AI 药物研发仍处在较早期的阶段,不论是在技术创新还是应用落地上还存在着比较大的挑战,例如体外和体内的相关性问题以及动物模型和临床相关性的问题等。


不过前景可期。最近几年,AI 在药物研发领域的存在感越来越高,尤其 2020 年开年以来猝然爆发的新冠疫情也让 AI+新药研发博得了众多关注,当一场类似的大流行病袭来时,药物研发的速度就成为和生命赛跑的关键。


鉴于 AI 在疫情防控中所发挥的积极作用,今年 4 月,科技部表示将支持研究人工智能技术在传染病防治、药物研发等方面的应用。政策性利好之下,AI+药物研发或将迎来一个新的风口。


可以预见的是,AI 技术的应用,将在加速整个药物研发的进程中发挥着越来越重要的作用。AI 究竟能够为药物研发带来怎样的可能性,期待时间来验证。

采访嘉宾介绍

张佩宇博士,晶泰科技首席科学家,主导研发晶泰科技 ID4 人工智能药物创制平台。张佩宇是中科院博士,曾任大连化物所副研究员,有十余年计算化学算法开发经验,在国内外重要刊物上发表研究论文 30 余篇。


2020-06-02 17:068384
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 527.0 次阅读, 收获喜欢 1974 次。

关注

评论

发布
暂无评论
发现更多内容

分布式数据库架构:高可用、高性能的数据存储

互联网工科生

分布式数据库 高性能 高可用性

生成式AI:全球科技革命的驱动力

百度开发者中心

教育 #人工智能 ChatGPT 生成式AI

ETL 小技巧:文件输出插件数据写入空闲时间阈值配置及作用

大河

缓冲区 ETL bboss 文件输出

社交语聊平台运营,需要哪些资质?语聊APP原生开发和混合uniapp开发的利弊分析

山东布谷科技胡月

语音聊天系统软件开发 语音直播平台开发 语音聊天室开发 语音程序源码 社交直播APP开发

死锁产生的条件及解决方法

红袖添香

Java 多线程 死锁

低成本生成式AI技术:推动AI普及的关键

百度开发者中心

医疗 #人工智能 ChatGPT 文心一言

《守望先锋 2》性能提升高达33%!英特尔锐炫从未止步

E科讯

加入DevRun软件开发流水线实战营,即刻开启你的职场竞争力之旅!

科技热闻

生成式AI助力高效写作

百度开发者中心

大模型 #人工智能 ChatGPT 生成式AI

在数字化时代的挑战与解决:跨国大文件传输方法

镭速

大文件跨国传输 跨国快速传输大文件

用案例带你认识决策树,解锁洞察力

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

Lightroom下载 图像处理软件Lightroom Classic 2023 mac完美激活版

mac

苹果mac Windows软件 Lightroom Classic 2023 lrc2023 数字图像处理软件

电脑硬件迭代快,对仿真软件有什么影响?

智造软件

仿真软件 电脑硬件 结构仿真 电脑配置 硬件配置

华为云GaussDB打造最可信的数据库,给世界一个更优选择

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

和鲸 × 临床医学丨“人”作为一生命体在 AI for Science 过程中的作用与交互

ModelWhale

数据科学 临床医学 AI for Science 交叉学科 临床研究

容器化微服务:用Kubernetes实现弹性部署

高端章鱼哥

Kubernetes 微服务 容器化

第三周作业

大肚皮狒狒

Easysearch 跨集群复制实战

极限实验室

easysearch

软件测试|如何使用ChatGPT生成思维导图

霍格沃兹测试开发学社

有奖活动 | 以代码之名,写出对Ta的爱

HarmonyOS开发者

HarmonyOS

生成式AI:内容创作新革命

百度开发者中心

自然语言处理 内容 #人工智能 文心一言

软件测试|人工智能如何帮助测试工程师解决问题?

霍格沃兹测试开发学社

技术领先的用友iuap平台,助力升级数智化底座、驾驭数智未来

用友BIP

2023全球商业创新大会

生成式AI技术市场现状与发展前景展望

百度开发者中心

#人工智能 生成式AI 文心一言

生成式AI助力智能未来

百度开发者中心

#人工智能 ChatGPT 生成式AI 文心一言

头脑风暴小工具-影响地图

Bruce Talk

敏捷开发 Agile Product Owner 影响地图

又一可视化低代码神器!云耀云服务器L实例正式发布

mecchi

软件开发 云主机 云服务器 博客搭建

企业国际大数据传输必须了解的5种跨国快速传输大文件工具

镭速

大文件传输 跨国传输大数据

生成式AI引领未来传媒业发展趋势

百度开发者中心

媒体 #人工智能 生成式AI 文心一言

​Elastic Stack最佳实践系列:Beats->ES,一个更轻型的架构选择

腾讯云大数据

ES

AI可以是药神_AI&大模型_刘燕_InfoQ精选文章