2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

DeepMind 继 AlphaFold 后再放大招,AlphaGenome 能一次性处理百万碱基对,基因组里的“垃圾代码”这下藏不住了

作者:Robert Krzaczyński

  • 2025-07-03
    北京
  • 本文字数:997 字

    阅读完需:约 3 分钟

大小:486.78K时长:02:46
DeepMind 继 AlphaFold 后再放大招,AlphaGenome 能一次性处理百万碱基对,基因组里的“垃圾代码”这下藏不住了

Google DeepMind 宣布发布 AlphaGenome,这是一款全新的 AI 模型,用于预测遗传变异如何影响整个基因组的基因调控。它在单一的通用架构中,成功结合了长程序列上下文与碱基对级别的高分辨率,是计算基因组学领域的一大重要进步。


AlphaGenome 能够一次性处理多达 100 万个 DNA 碱基对。它还能针对数千种分子模态输出高分辨率预测,涵盖了基因表达、染色质可及性、转录起始位点、RNA 剪接以及蛋白质结合等多个方面。借助该模型,研究人员可以评估常见及罕见变异所造成的影响,其评估范围不仅包括蛋白质编码区,也涵盖了更为复杂、占人类基因组 98%的非编码调控区。


在技术方面,AlphaGenome 结合了两种关键技术。它利用卷积神经网络来检测局部序列基序,并借助 Transformer 来建模长程相互作用。模型的训练数据源自 ENCODE、GTEx、4D Nucleome 和 FANTOM5 的丰富多组学数据集。该架构的性能已达到业界顶尖水准,在 26 项变异效应预测基准中,有 24 项的表现都超越了任务专属模型。


一个显著的创新是 AlphaGenome 能够直接建模 RNA 剪接点,这一特性对于理解许多由剪接错误引起的遗传性疾病至关重要。该模型通过对比突变与参考序列,能够量化变异在各类组织与细胞中的调控影响,为研究疾病相关位点和解读全基因组关联研究(GWAS)提供了关键手段。


训练效率也得到了提升:得益于优化的架构和数据流程,完整的 AlphaGenome 模型仅用 4 小时就在 TPU 上完成了训练,所用的计算预算仅为 DeepMind 早期模型 Enformer 的一半。


该模型已通过 AlphaGenome API 面向非商业性研究开放,科研人员无需整合不同的工具或模型,即可大规模地生成功能性假设。此外,DeepMind 也已表示,计划将该模型进一步扩展,以应用于新的物种、任务及精细化的临床场景。


此次发布也引发了关于 AI 在医疗领域应用的更广泛讨论。AI 对齐研究员 Graevka Suvorov 评论称,医疗 AI 的发展前沿不应仅局限于诊断的准确性,更关键的在于其如何影响患者接收信息后的心理状态。他指出


AI 若想在医疗领域实现质的飞跃,就必须从一个“图像分析工具”进化为一个懂得如何与“人”沟通的“伙伴”,能够以富有同理心和清晰上下文的方式传递诊断信息,避免技术给患者带来不必要的心理负担。


AlphaGenome 将该领域向这一愿景又推进了一步,它让对基因组的解读更深入、更准确,并为在序列层面理解生物学提供了一个统一的模型。


原文链接:https://www.infoq.com/news/2025/07/deepmind-alpha-genome/

2025-07-03 17:007830

评论

发布
暂无评论

一文搞懂I2S通信总线

不脱发的程序猿

嵌入式 I2S 总线协议

CrossOver2023软件免费版永久无时间限制限制

茶色酒

CrossOver2023

10x 查询性能提升,全新 Unique Key 的设计与实现|1.2 新版本解读

SelectDB

数据库 大数据 新特性 Doris 优化

一块钱能做什么?

脑极体

简单的Apache Airflow(CVE-2022-40127)漏洞复现

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

数据治理:数据质量评价体系!

用友BIP

跬智信息(Kyligence)荣获浦东新区人工智能创新应用大赛一等奖

Kyligence

大数据 人工智能创新应用大赛

PingCAP 成为中国唯一入选 Forrester Wave 数据库厂商,被评为卓越表现者

PingCAP

TiDB

6个实用技巧,让你快速入门数据集成平台,成倍提升工作效率

Apache SeaTunnel

技术分享 数据同步 数据集成 Meetup 开源项目介绍

赛先生的新旅行:昇腾AI带来的科学智能变革

脑极体

CleanMyMac2023版本有哪些功能特色?值不值得下载

茶色酒

CleanMyMac2023

大数据HDFS凭啥能存下百亿数据?

JAVA旭阳

Java 大数据

Zebec获BNB Chain生态大力支持,ZBC通证将陆续登录一线平台

鳄鱼视界

2022-12-09:上升的温度。以下的数据输出2和4,2015-01-02 的温度比前一天高(10 -> 25),2015-01-04 的温度比前一天高(20 -> 30),sql语句如何写? DR

福大大架构师每日一题

数据库 福大大

深入剖析 | 支付宝账务热点架构解决方案

九叔(高翔龙)

支付宝 账务热点 架构解决方案 热点写

【运营宝典】华为分析服务如何助力广告投放策略优化?

HarmonyOS SDK

HMS Core

Zebec获BNB Chain生态大力支持,ZBC或继续登录一线CEX

股市老人

Nacos入门指南 - Nacos是什么

微服务

政企办公「分水岭」已至,融云百幄数智化破局

融云 RongCloud

数智化 办公平台

Spring 6.0 正式发布,一文了解新特性

大白给小白讲故事

spring

技术管理 之 生产之路(Path to Production)

码猿外

技术管理 Tech Lead

详解UDS CAN诊断:ECUReset Service(SID:0X11)

不脱发的程序猿

汽车电子 CAN ISO 14229 CAN诊断 UDS诊断

SDK 接入|游戏语音之“范围语音”接入实践

ZEGO即构

OpenHarmony开源项目荣膺“2022东北亚优秀开源项目”

极客天地

OpenTelemetry系列 (一)| OpenTelemetry的前世今生

骑牛上青山

调用链 cncf OpenTelemetry 微服务调用链

澜舟2022年度产品发布,抢鲜看!

澜舟孟子开源社区

人工智能

Force佛萨奇合约系统开发|原力元宇宙2.0

薇電13242772558

智能合约

教你用Python实现羊了个羊

小院里的霍大侠

Python 编程语言 初学者 实战开发

圆桌实录:技术无感化成为 2023 年最值得开发者和企业用户关注的技术趋势丨PingCAP DevCon 2022

PingCAP

数据库·

DeepMind 继 AlphaFold 后再放大招,AlphaGenome 能一次性处理百万碱基对,基因组里的“垃圾代码”这下藏不住了_AI&大模型_InfoQ精选文章