【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

AI 可以是药神

  • 2020-06-02
  • 本文字数:5973 字

    阅读完需:约 20 分钟

AI可以是药神

新药研发是一场“马拉松”,AI 能让它实现弯道超车吗?

AI 加速新药研发翻过三座大山

长研发周期,高研发成本,低成功率是新药研发的“三座大山”。


一款新药从开始研发到获批准上市,需要 10-15 年的时间,平均耗费约 26 亿美元,临床成功率不到 10%,这意味着有 90% 以上的药物会在临床阶段被淘汰。


早年,强生副董事长兼首席科学官 Paul Stoffels 曾形容,一款新药的研发上市要难于制造飞机。


解决传统制药行业普遍的难题,AI 或许是一把好的钥匙。


新药研发要经历药物作用靶点确认、先导化合物确定、临床前候选药物选定、临床前研究、临床等多个阶段。晶泰科技首席科学家张佩宇在接受 InfoQ 采访时表示,从靶点确定到临床候选药物环节,利用传统方法,大概需要 4-6 年时间才能获得想要的分子,而通过 AI+计算的方法可以将时间缩短到 1-2 年。


另据 TechEmergence 的一份报告显示,AI 可以将新药研发的成功率从 12%提高到 14%,能够为生物制药行业节省数十亿美元研发费用。


晶泰科技是国内最早将 AI 用于辅助制药的公司之一,2017 年,国内 AI 药物发现领域还几乎是一片空白,创业公司也寥寥无几,而成立 3 年的晶泰科技已在该领域有所探索和布局。其主要涉足药物发现和晶型研究,聚焦于利用 AI、量子物理、计算化学、云计算等技术,提升药物研究的效率和成功率。



成立 5 年来,晶泰曾先后获得来自谷歌、腾讯、红杉中国、晨兴资本等顶级投资机构的融资,是目前全球 AI 药物研发领域融资额度最高的公司之一。


它的成长历程无疑是市场和资本对于这个领域投注更多目光的见证和缩影。据汇众研究院不完全统计,截止 2019 年 3 月,目前全球 AI 药物研发创业公司有 163 家(其中国内仅 14 家)。而 2 年之前这个数字不足 30 家。截止 2019 年 3 月,国内外共 140 多家 AI+新药研发公司获得融资,累计交易次数为 342 起,获得融资总额为 483 亿美元,超过了 2017 年全年的融资总额(约 190 亿美元)。



全球药物发现与开发领域的顶级 AI 公司与制药、科技公司之间的互联网络。图源:Forbes.com,作者: Yiannis Mouratidis 


去年 5 月,全球首款 AI 设计药物 —“涡轮增压”流感疫苗的问世,更是让人们看到了 AI 在药物发现中的潜力,或许未来,AI 将创造新的药物研发模式。

在 10 的 60 次方空间搜索有效药物分子

张佩宇表示,与传统的药物研发过程相比,AI 能够极大的起到降本增效的作用。


“新药研发其实有一定的碰运气成分,因此,如果探索的化学空间不够广泛多样,很可能就错失了机会”。


2017 年,《Nature》的一篇文章曾提到一个很有意思的数据,在整个药物分子的化学空间里,可存在的药物分子的数量大概是 10 的 60 次方那么多。这个数量超过了太阳系中所有原子的数(10 的 50 次方)。但目前,实验方法是不可能将这些分子全都合成出来的,现有的类药分子数据库能接触到的分子数仅约有 10 的 11 次方左右。


传统的药物研发更多以药化专家为主导,由药化专家想出几十个分子去做计算辅助。早期的药物研发是一门艺术,因为如果换了专家,分子也便不同。但通过 AI 可以产生大量分子,规模高达百万、千万量级。因此,在分子产生环节,AI 可以覆盖更全面的化学空间。



“医药研发失败率很高,每 5000~10000 个进入研发管线的分子当中,只有一个才能真正上市。因此当第一次合成后,要不断迭代和筛选。这个过程呈现‘漏斗’形状,越能够高效地找到合适的分子,就表示药物研发效率越高。否则,很有可能就是在反反复复做实验,很多年才能找到一个真正能够往前推进的真正有潜力的候选药物分子”。


张佩宇告诉 InfoQ,晶泰科技利用最新的 AI 算法来助力分子设计中的筛选过程。相较于使用传统的计算方法,可以有效地提升获得优良性质的分子的比例——即富集率——至 8-10 倍,从而大大地降低实验筛选的时间和成本。


在评估环节,因为分子较少,传统方式会采用一些较粗略的方法进行评估后做实验。而晶泰科技的智能药物研发平台可以采用高精度的方法进行快速、全面的评估,从几百万个候选分子逐步聚焦到很少的数量,然后由药化专家去做最终的合成难度评估,选择 10 个左右的分子去做实验验证、迭代。


“效率,永远是传统实验的一个瓶颈”。现阶段的人工智能药物研发过程,分子的产生、设计、评估,还很大程度上依靠科学家干预。张佩宇希望下一步可以实现全自动设计、自动合成,甚至在未来实现自动检测和迭代。他透露,晶泰科技正在进行一些提高实验效率的探索,从而进一步提升药物研发的效率。

从晶型预测到新药发现

晶型预测是晶泰科技的起家业务。2014 年,温书豪、马健、赖力鹏三位量子物理学家在麻省理工学院的校园里创办了晶泰科技。他们认为,晶型预测和晶型结构确定本质上是一个物理问题,可以通过更加精确、快速的 AI+ 物理和云计算的方法来解决。


晶体结构研究是化合物研究的一大重点,是分子从实验室里的药物有效成分向货架上的药物产品转变的关键一步。化合物具有能够形成不同晶体结构的特点(多晶型现象)。化合物本身的关键理化性质,如密度、外观形态、溶解度、溶解速率等部分地由其晶体结构决定。对于药品,晶体结构可以显著影响药物的生物利用度,最终影响药物的治疗表现。


晶型的稳定性对进行药物研究至关重要,它关系着药物的质量与安全性。如果稳定性不好,药物可能会在临床阶段或者上市阶段产生晶型转变,造成关键性质的变化,导致召回或需要重做部分或全部的临床研究,这意味着巨大的时间成本和金钱损失。


晶型预测是一个很难的问题。传统的研发中,研究人员通过设置不同的结晶条件进行结晶实验,但很难通过实验试错在短时间内获得所有晶型,或确定已获得的就是最稳定的晶型。而高精度量子力学计算、结合 AI 的方法可以产生大量可能的晶型结构并迭代、优化,最终锁定性质最稳定、最适合用于药物研发的晶型,或盐型、共晶、水合物,在实现全面性的搜索、维持计算的高精确度的同时,显著节省计算成本与时间,协助科研人员利用有限的实验结果,作出关键的研发决策,为药企解决药物固态研发一大痛点。



晶泰科技的晶型预测等药物固态研发服务


晶泰科技创立早期将大量的精力铺在了晶型的搜索以及稳定性研究上。张佩宇回忆,早期团队在攻克复杂的晶体结构体系算法上遇到了很大的难题,预测不出来,结构怎么算都不对。“那段时间大家心情比较低落,因为如果我们只能做简单的体系,做不了特别复杂的,能做的项目就比较少,适用性和对药物工业的实用意义都大打折扣”。


团队最终决定展开技术攻关。一个最直接的变化是,持续性加班的日子变多了,“那段时间每天搞到早上四五点”,张佩宇说,“不过也挺有意思,每天早上起来去测一个更复杂的体系,然后调整计算,算到半夜两三点觉得好像调的差不多了,然后提交,第二天早上再来看结果,如此循环往复”。


功夫不负有心人,通过持续改进,晶泰团队的晶型预测能力终取得突破,从最开始的只能做简单的体系,到能够做五六十个自由度的复杂体系,最后算法成型,实现了盐型、共晶、水合物和溶剂合物都能快速、成功预测的技术突破。


这也成为晶泰科技后来的核心竞争力之一。现在,药物的复杂度提升对药物的晶型预测提出了更高的要求。张佩宇表示,晶泰科技的晶型预测的成功率达到 100%,而国外的一些组织目前仍只能针对简单体系做预测。


高准确率背后得益于较强的算力资源保障。晶泰科技的算法部署在亚马逊、腾讯、阿里、谷歌等厂商的云上,可调动起 100 万个计算核心,因此可以做到短时间内预测,能够在大概 2 周左右出预测结果。这相对于传统实验所需时间(几个月-数年)显著缩短,也保障了精确度和成功率。


晶泰科技持续研发与创新,将其技术优势拓展到上下游的研发阶段当中。据介绍,晶泰团队最近基于一种叫 FEP(自由能微扰)的高精度预测流程进行了全新的改良,这是新药发现中最高精度的计算蛋白和药物分子相互作用的方法。晶泰科技的 XFEP 方法能够将 AI 和量子物理计算结合起来,更好的评估活性分子与靶点的亲和力,从而将活性不好的分子提前筛选出来并淘汰。晶泰科技的云端平台可以调动上千个 GPU,在一天内可做几千个 FEP 计算,能迅速评估大量分子,缩短对分子评估的时间周期,提高实验筛选的针对性和效率。



药物设计中用自由能微扰计算(FEP)流程获得不同分子设计与同一靶标的结合自由能差,评估活性


值得一提的是,FEP 等高精度计算方法能够为制药 AI 的一个关键问题——数据短缺提供新的出路。通过高精度算法可以产生大量的高精度数据,这些虚拟数据可以用来做 AI 建模,之后再去评估想要的分子。实验数据难获得且昂贵,虚拟数据是其有效补充。除虚拟数据,晶泰也拥有自建的实验数据库。


最近几年,晶泰科技开始不断加大对新药的设计与研发业务的布局,主做小分子药物设计,同时也有抗体研发设计和多肽研发设计。该业务一方面是与美国 MIT、哈佛等顶尖科研机构的生物学家合作推新药管线,前者选定靶点,晶泰科技通过其 AI 平台找合适的化合物、候选药物以推进临床前研究。另一方面,晶泰科技也为国内药企服务,加速其研发的内部管线。



晶泰科技药物设计服务流程


据了解,2017 年 7 月,晶泰科技曾免费推出面向有科研和数据处理需求的单位的人工智能模型训练平台 AtomPai,预搭载了几十种常用算法模型与自动的数据可视化功能。而针对药物工业,晶泰科技的智能药物研发平台–ID4 平台涵盖了从药物发现、药物晶型(固态)研发等方向的众多工具和几十种药物性质预测算法,可用于药物研发多个关键环节的核心问题。该平台分为 4 层,算力资源、调度平台、算法平台,以及通用力场、XFEP 等工具和解决方案。


ID4 平台主要优势在于预见性预测,在早期更全面地评估所有潜在的药物分子的物理、化学、药学性质,优先推进性质更理想、更有可能成功的分子,把大批难以成功开发或者有重大性质缺陷的分子提早筛选下去。“ID4 用精确的算法在早期综合评估分析分子候选,用人工智能和算法的先见之明去解决药物研发的一些后顾之忧”。

忍痛推倒重来 98%成功率的算法

与其他 AI 药物研发创业公司相比,晶泰科技的技术商业化落地进程开始的比较早。这要从 2016 年晶泰与全球最大的生物制药公司辉瑞的一次结缘说起。


当时辉瑞组织了一次晶型预测盲测。用从未对外公布过的不同难度的分子,对学界和市面上所有的解决方案进行横向评估。张佩宇回忆,团队用了 2 个月时间完成了盲测预测。忐忑的心情一直持续到 12 月份,结果终于出来了,晶泰团队预测的晶型 100%匹配。



晶泰科技帮助药物研发科学家预测并优化某候选药物分子的最优晶型。作者:JOSEPH F. KRZYZANIAK。来源:辉瑞网站 breakthroughs.com ,文章《How Quantum Physics and AI is Disrupting Drug Discovery & Development》"


当时晶泰仅是一个成立 2 年的小团队,从诸多晶型预测团队中脱颖而出。现在回忆起来,整个盲测的过程,张佩宇还历历在目,他将这看作自己和团队的一个高光时刻。


这次盲测成功标志着晶泰的商业化走出的重要一步,在此之前,团队一直全身心铺在研发上,与药企只有几个有限规模的合作项目。后来,双方达成战略合作,晶泰科技不仅为辉瑞提供晶型预测的技术服务,还为其新药发现搭建小分子药物模拟算法平台。辉瑞在其网站撰文为晶泰科技做介绍时说,晶泰科技的技术已经改变了辉瑞制药的方法,并有潜力改变药物工业。


最近几年,传统大型药企和 AI 公司合作成为了一大趋势,不止辉瑞,默沙东、葛兰素史克等药企也和 AI 公司合作紧密。AI 能够快速找到新的靶点,更快找到适合的候选分子并预测晶型等药物开发的关键研究问题,从而提高研发效率,这是 AI 公司受到传统药企青睐的原因。


不过和大药企合作并不像想象中那么简单,它们普遍对于 AI 公司的技术实力要求极高,且对于细节把控严格。


一个难点在于 AI 如何自证价值。张佩宇认为,需要正视一个新技术走向落地是需要一个过程的,有些药企会觉得传统的方式可以做药,为什么一定要用 AI 平台?


“现在大家都在早期阶段,走的最快的‘AI+ 算法’研发药物也仍在临床试验阶段,如何走一条没有人走过的路,并能够跟客户证明,虽然算法作用于研发早期,但你能直接看到效果验证,且在中期甚至临床都能使项目收益,这就需要持续的市场培育和信心构建”。


另一个考验在于如何在工程和技术间取得平衡。这里面经历了一段痛苦的磨合过程。张佩宇对一个预测算法开发的项目印象很深刻。当时这个项目做到 95%-98%的准确度花了很多时间很多人力物力,再提升却停滞不前,项目陷入了瓶颈。


往前走走不下去,止步于此又不甘心。团队面临着两难选择。最后团队还是决定“痛下杀手”,将算法推倒重来,从底层的结构重新去改原本的算法。


“这真的是需要下很大的决心,因为从 98%到 100% ,它的修改已经不是小的改进,而是需要一定魄力的,前面已经投入了众多资源,再投入成本是否 hold 住,管理层需要从投入-产出上作综合评估。但我们还是更希望突破技术壁垒,将复杂的分子算到 100%精确”。


最终,团队想出了新方案,又加入了一些新的模型和新算法,项目取得了成功。


张佩宇觉得有一个能打的团队和算法实力对一家年轻的公司来说格外重要,当遇到困难时,需要有敢于破局重来的勇气。这份执着让晶泰的商业化之路走的更顺畅,“TO B 的业务一开始门槛很高,但只要你跟对方合作起来,别人对你产生了认可,会一步步将更多的产品和服务应用起来”。

结 语

现阶段,AI 药物研发仍处在较早期的阶段,不论是在技术创新还是应用落地上还存在着比较大的挑战,例如体外和体内的相关性问题以及动物模型和临床相关性的问题等。


不过前景可期。最近几年,AI 在药物研发领域的存在感越来越高,尤其 2020 年开年以来猝然爆发的新冠疫情也让 AI+新药研发博得了众多关注,当一场类似的大流行病袭来时,药物研发的速度就成为和生命赛跑的关键。


鉴于 AI 在疫情防控中所发挥的积极作用,今年 4 月,科技部表示将支持研究人工智能技术在传染病防治、药物研发等方面的应用。政策性利好之下,AI+药物研发或将迎来一个新的风口。


可以预见的是,AI 技术的应用,将在加速整个药物研发的进程中发挥着越来越重要的作用。AI 究竟能够为药物研发带来怎样的可能性,期待时间来验证。

采访嘉宾介绍

张佩宇博士,晶泰科技首席科学家,主导研发晶泰科技 ID4 人工智能药物创制平台。张佩宇是中科院博士,曾任大连化物所副研究员,有十余年计算化学算法开发经验,在国内外重要刊物上发表研究论文 30 余篇。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-06-02 17:068252
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 489.8 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

3D模型材质编辑

3D建模设计

3D纹理 3D材质 模型渲染

倒计时 1 天,2023 IoTDB 用户大会期待与您相见!

Apache IoTDB

GoodTask for Mac(日历任务管理工具)v7.6.4中文激活版

iMac小白

中小企业的上云之选,华为云智能化管理引领数字化未来

YG科技

华为云耀云服务器L实例:轻量应用服务器,初创和成长型企业的理想选择

YG科技

OmniReader Pro for mac(全能阅读器)v2.6.2激活版

iMac小白

Retrobatch for mac(图像批量处理软件)v2.0.3激活版

iMac小白

URL Manager Pro for Mac(浏览器标签管理应用)v6.4激活版

iMac小白

云计算时代新选择:华为云耀云服务器L实例助力业务轻松上云

YG科技

2023-12-02:用go语言,如何求模立方根? x^3=a mod p, p是大于等于3的大质数, a是1到p-1范围的整数常数, x也是1到p-1范围的整数,求x。 p过大,x不能从1到p-1遍

福大大架构师每日一题

福大大架构师每日一题

HuggingFists-低代码玩转LLM RAG(1) Embedding

数由科技

低代码 Embedding LLM rag huggingfists

架构实战营模块 1 作业

陈斌

架构实战营

MediaInfo for mac(媒体信息检测软件)v23.11免激活版

iMac小白

[大厂实践] Pinterest通用计算平台实践

俞凡

架构 Kubernetes 云原生 大厂实践 Pinterest

iA Writer for Mac(mac好用的写作软件)v7.0.0中文激活版

影影绰绰一往直前

Nacos配置中心脱敏

姚秋实(Nacol)

安全 nacos 架构设计 jasypt 配置中心

高防服务器一般价格多少钱一台?

Geek_f19a80

服务器

03 | 复杂度分析(上):如何分析、统计算法的执行效率和资源消耗?

鲁米

NodeJS 了解和快速入门 - 实现 http 服务 & 操作 mysql教程。

百度搜索:蓝易云

chrome MySQL Linux Node 云服务器

Performance Index 64 Pro for mac(性能检测软件)v4.2.12激活版

iMac小白

Magic Disk Cleaner for mac(磁盘垃圾清理工具)v2.5.3激活版

iMac小白

MATLAB实战 | S函数的设计与应用

TiAmo

matlab

CoinList最新项目BitsCrunch是不是NFT的侦探

币离海

Coinlist BitsCrunch BCUT

基于TCP/UDP的Socket编程

百度搜索:蓝易云

Linux TCP 运维 socket udp

ZooKeeper应用场景综述

极客罗杰

Apeaksoft iPhone Eraser for Mac(iPhone数据清除工具)v1.0.20免激活版

iMac小白

EdgeView 4 for Mac(快速图像查看器)v4.4激活版

iMac小白

iZip Archiver Pro for mac(强大的解压缩软件)v4.7.47激活版

iMac小白

云计算新选择,华为云耀云服务器L实例助您轻松上云

YG科技

云计算新标杆!华为云推出全新企业上云新产品

YG科技

10款java代码检查工具

鲁米

AI可以是药神_AI&大模型_刘燕_InfoQ精选文章