写点什么

AI 的“脑回路”终于能看见了?OpenAI 发布稀疏模型,让推理透明化

  • 2025-12-15
    北京
  • 本文字数:1295 字

    阅读完需:约 4 分钟

大小:648.47K时长:03:41
AI 的“脑回路”终于能看见了?OpenAI发布稀疏模型,让推理透明化

神经网络正在推动最强大的人工智能系统,但我们仍无法真正“读懂”它们是如何得出答案的。“可解释性”,仍然是 AI 最大的黑箱。


昨天,OpenAI 开源了一种新模型 Circuit-Sparsity参数只有 0.4B,99.9% 的权重为 0。这种极端稀疏的结构,让内部计算结构第一次呈现出一种接近“电路图”的清晰感,而不是传统 Transformer 那种密密麻麻、缠成一团的黑箱。对于可解释性研究来说,这是一个更容易“下手”的形态。


什么是可解释性?本质是试图回答一个简单问题:我们能不能看懂模型是怎么推理的。


目前主流的可解释性路线有两条,一条是链式思维,让模型自己“写下思维过程”,很好用,但模型随时可能瞎编。另一条是机理可解释性,从最底层的权重和神经元开始,一点点拆模型,试图逆向工程出它的内部算法。这条路很扎实,但面对 GPT-4 和 GPT-5 这种量级,就像从 DNA 推导整个人类行为,难度可想而知。


OpenAI 选择从另一个方向切入,既然难以拆解复杂的大模型,不如从源头入手,将其设计为“可拆解”的形态。Circuit-Sparsity 采用的是 GPT-2 风格架构,但在训练时做了一个关键调整——强行把绝大多数权重固定为 0,让模型“原生稀疏”



稠密模型中,一个神经元可能和成千上万个节点相连,但在这种极致稀疏的模型里,几乎所有连接都被砍掉,只留下最必要的那几条。神经元之间的关系因此变得简单、明确,像是一块块职能分明的小电路板。


为了看看这种结构是否真的更容易解释,研究团队设计了一些非常基础的测试,例如判断一个字符串该以单引号还是双引号结尾,推断 Python 变量的类型,或者判断一行代码是否应以冒号收尾。接着,研究人员用剪枝的方法,从模型中“挖出”完成这些任务的最小电路——只保留模型实际在用的节点和连接,把其他部分全部关闭,看模型是否还能完成任务。



结果是干净得有些出乎意料:同样的任务,稀疏模型的电路只有稠密模型的 1/16 大小;关键节点少得可数,删掉任何一个模型就立刻失败;而在某些任务上,完整的推理流程甚至只依赖两个 MLP 神经元和一个注意力头,像手写算法一样直给。


研究者还注意到一个规律:稀疏度越高,电路越干净,可解释性越强而增大模型规模,则可以在保持稀疏结构的前提下维持较高能力。这说明“大但稀疏”的模型可能是可解释性与性能之间更好的平衡点


当然,稀疏 Transformer 目前并不能直接替代 GPT-4 或 GPT-5。论文非常坦率地指出,稀疏模型的训练和推理速度比稠密模型慢 100 到 1000 倍,因为现有 GPU、TPU 都是为密集矩阵设计的。再加上人工解读电路仍然非常耗时,这种模型短期内不可能成为前沿大模型的架构基础。


但它有一个更重要的意义:它可以作为可解释性研究的“模型生物学实验体”。研究人员可以先在这种干净、小型、可读的模型中搞清楚 Transformer 的底层规律,再尝试迁移到真正的前沿大模型上。这带来了两条新的研究路线:一种是从密集模型中直接提取稀疏电路,不需要重新训练;另一种是让稀疏结构变得更高效,使它从研究工具逐渐走向工程实践。


OpenAI 想让未来的大模型摆脱“不可拆解”的黑箱属性,使每一步计算过程都像电路图一样清晰可追溯。Circuit-Sparsity 或许只是这一探索路上的一块踏脚石,它不一定会成为主流方案,但足以改变讨论的方向。

2025-12-15 20:243

评论

发布
暂无评论

每天学习10个实用Javascript代码片段(五)

devpoint

定时器 JavaScrip 8月日更

3 分钟了解 JSON Schema

程序员鱼皮

Java json 数据库 大前端 后端

网络上数据通信过程

一个大红包

8月日更

数据挖掘经典算法之K-邻近算法(超详细附代码)

Python研究者

8月日更

网络攻防学习笔记 Day115

穿过生命散发芬芳

网络安全 8月日更

下载超过10万次?阿里大佬的《高并发、性能调优笔记》一战封神

Java架构师迁哥

JS遍历循环方法性能对比:for/while/for in/for of/map/foreach/every

zhoulujun

foreach map for for in

ShardingSphere Proxy 初步体验

ShardingSphere-Proxy

从λ演算到函数式编程聊闭包(1):闭包概念在Java/PHP/JS中形式

zhoulujun

闭包 闭包函数

Go- 递归函数

HelloBug

递归 Go 语言

架构实战营1期模块6作业——微服务架构

tt

架构实战营

Go- 闭包函数

HelloBug

使用明道云搭建电梯维修与保养系统

明道云

从λ演算到函数式编程聊闭包(2):彻底理解JavaScript闭包规则

zhoulujun

闭包 闭包函数

Go- 函数执行时间

HelloBug

Go 语言 函数执行时间

特斯拉依旧头铁坚持视觉路线,激光雷达会笑到最后吗?

脑极体

本科毕业六年,裸辞备战三个月,四面阿里巴巴定级P7

编程susu

Java 编程 程序员 面试 计算机

Go,一文搞懂 defer 实现原理

微客鸟窝

Go 语言 8月日更

客户需求难以推进和实现?企业如何有效管理项目需求?

优秀

项目管理

太厉害了!腾讯T4大牛把《数据结构与算法》讲透了,带源码笔记

编程susu

Java 编程 程序员 计算机 技术宅

LeetCode刷题09-简单 回文数

ベ布小禅

8月日更

解决生命科学研究痛点,北鲲云计算着力打造行业解决方案

北鲲云

Python Qt GUI设计:将UI文件转换为Python文件的三种妙招(基础篇—2)

不脱发的程序猿

Python qt GUI UI文件转换为Python文件

JIT-动态编译与AOT-静态编译:java/ java/ JavaScript/Dart乱谈

zhoulujun

dart JIT AOT 动态编译 静态编译

按下数字化转型快进键!DataPipeline与星环大数据平台完成产品兼容互认证

DataPipeline数见科技

微信业务架构图 & 学生管理系统方案

缘分呐

架构 设计

模块一

树建

架构实战营

正经人一辈子都用不到的 JavaScript 方法总结 (一)

编程三昧

JavaScript 大前端 8月日更 模板字符串 String.raw

模块(一)什么是架构

我是一只小小鸟

实时数据引擎系列(二): 批流一体的数据

tapdata

混合模型与期望最大化算法(三)

Databri_AI

算法 混合模型

AI 的“脑回路”终于能看见了?OpenAI发布稀疏模型,让推理透明化_OpenAI_高允毅_InfoQ精选文章