写点什么

DeepMind 继 AlphaFold 后再放大招,AlphaGenome 能一次性处理百万碱基对,基因组里的“垃圾代码”这下藏不住了

作者:Robert Krzaczyński

  • 2025-07-03
    北京
  • 本文字数:997 字

    阅读完需:约 3 分钟

大小:486.78K时长:02:46
DeepMind 继 AlphaFold 后再放大招,AlphaGenome 能一次性处理百万碱基对,基因组里的“垃圾代码”这下藏不住了

Google DeepMind 宣布发布 AlphaGenome,这是一款全新的 AI 模型,用于预测遗传变异如何影响整个基因组的基因调控。它在单一的通用架构中,成功结合了长程序列上下文与碱基对级别的高分辨率,是计算基因组学领域的一大重要进步。


AlphaGenome 能够一次性处理多达 100 万个 DNA 碱基对。它还能针对数千种分子模态输出高分辨率预测,涵盖了基因表达、染色质可及性、转录起始位点、RNA 剪接以及蛋白质结合等多个方面。借助该模型,研究人员可以评估常见及罕见变异所造成的影响,其评估范围不仅包括蛋白质编码区,也涵盖了更为复杂、占人类基因组 98%的非编码调控区。


在技术方面,AlphaGenome 结合了两种关键技术。它利用卷积神经网络来检测局部序列基序,并借助 Transformer 来建模长程相互作用。模型的训练数据源自 ENCODE、GTEx、4D Nucleome 和 FANTOM5 的丰富多组学数据集。该架构的性能已达到业界顶尖水准,在 26 项变异效应预测基准中,有 24 项的表现都超越了任务专属模型。


一个显著的创新是 AlphaGenome 能够直接建模 RNA 剪接点,这一特性对于理解许多由剪接错误引起的遗传性疾病至关重要。该模型通过对比突变与参考序列,能够量化变异在各类组织与细胞中的调控影响,为研究疾病相关位点和解读全基因组关联研究(GWAS)提供了关键手段。


训练效率也得到了提升:得益于优化的架构和数据流程,完整的 AlphaGenome 模型仅用 4 小时就在 TPU 上完成了训练,所用的计算预算仅为 DeepMind 早期模型 Enformer 的一半。


该模型已通过 AlphaGenome API 面向非商业性研究开放,科研人员无需整合不同的工具或模型,即可大规模地生成功能性假设。此外,DeepMind 也已表示,计划将该模型进一步扩展,以应用于新的物种、任务及精细化的临床场景。


此次发布也引发了关于 AI 在医疗领域应用的更广泛讨论。AI 对齐研究员 Graevka Suvorov 评论称,医疗 AI 的发展前沿不应仅局限于诊断的准确性,更关键的在于其如何影响患者接收信息后的心理状态。他指出


AI 若想在医疗领域实现质的飞跃,就必须从一个“图像分析工具”进化为一个懂得如何与“人”沟通的“伙伴”,能够以富有同理心和清晰上下文的方式传递诊断信息,避免技术给患者带来不必要的心理负担。


AlphaGenome 将该领域向这一愿景又推进了一步,它让对基因组的解读更深入、更准确,并为在序列层面理解生物学提供了一个统一的模型。


原文链接:https://www.infoq.com/news/2025/07/deepmind-alpha-genome/

2025-07-03 17:007672

评论

发布
暂无评论

Byteman 使用指南(四)

FunTester

5分钟入门微信小游戏开发(三)

扬_帆_起_航

小游戏开发

中国移动智慧屏市场报告出炉,小度闺蜜机销量稳居全年度TOP1

科技大数据

语音社交app源码,语音聊天交友 社交app 婚恋交友专业开发 交友互动小程序源码_交友小程序源码,小程序交友源码

DUOKE七七

仅需3步,稳定快速!火山引擎边缘大模型网关全面支持DeepSeek系列模型

火山引擎边缘云

边缘计算 网关 火山引擎 #大模型 边缘智能

如何对测试同学进行能力定级

老张

团队管理 职场成长 工作规划

巧用通义灵码,提升前端研发效率

阿里巴巴云原生

阿里云 云原生 通义灵码

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

声网

Flink CDC YAML:面向数据集成的 API 设计

Apache Flink

大数据 flink 实时计算 API

基于 ZK 的 AI 基建 Zypher Network:Make Agent Secure Again

股市老人

INFINI Labs 产品更新 - Easysearch 增强 Rollup 能力,Console 完善 TopN 指标等

极限实验室

Rollup console Gateway easysearch TopN

小派科技完成C1+轮融资,营收三年连续翻倍增长

极客天地

零基础构建开源项目OpenIM桌面应用和pc web- Electron篇

Geek_1ef48b

地平线 3D 目标检测 Bevformer 参考算法 V2.0

地平线开发者

自动驾驶; 算法工具链 地平线征程6

IDEA 接入 DeepSeek,太酷了!

不在线第一只蜗牛

IDEA DeepSeek

深度洞察:低代码在企业数字化赋能进程中的策略与应用

不在线第一只蜗牛

人工智能 低代码 数字化 数智化

DeepSeek破圈,AI商业化临界点是如何被打开的?

脑极体

AI

巧用通义灵码,提升前端研发效率

阿里云云效

阿里云 云原生 通义灵码

免费体验100度算力包,极速部署不蒸馏满血版DeepSeek-R1!

九章云极DataCanvas

deeoseek

DeepMind 继 AlphaFold 后再放大招,AlphaGenome 能一次性处理百万碱基对,基因组里的“垃圾代码”这下藏不住了_AI&大模型_InfoQ精选文章