写点什么

GLM-4.5 发布,具有强大的推理、编码和代理能力

作者:Robert Krzaczyński

  • 2025-08-08
    北京
  • 本文字数:1001 字

    阅读完需:约 3 分钟

大小:550.59K时长:03:07
GLM-4.5发布,具有强大的推理、编码和代理能力

Zhipu AI发布了 GLM-4.5 和 GLM-4.5-Air。按照设计,这两个新 AI 模型可以在单一架构内处理推理、编码和代理任务。它们使用了双模式系统,可以在复杂问题解决和快速响应两种模式之间切换,从而提高准确性和速度。

 

GLM-4.5 总共有 355B 个参数,其中 32B 是活跃的,而它的轻量级版本 GLM-4.5-Air 则总共有 106B 个参数和 12B 的活跃参数。两个模型都使用专家混合(MoE)架构,并针对两种模式进行了优化:一种是“思考”模式,用于复杂推理和工具使用;另一种是“非思考”模式,用于快速响应。

 

GLM-4.5 的架构优先考虑深度而非广度——与 DeepSeek-V3 等模型形成了鲜明对比——并且每层使用 96 个注意力头。它还整合了 QK-Norm、分组查询注意力、多令牌预测和 Muon 优化器,加快收敛速度,改进推理性能。

 

训练是在一个有 22T 令牌的语料库上进行的,其中包括 7T 专门用于代码和推理的令牌,随后使用 Zhipu AI 自研的 slime RL 基础设施进行了强化学习。其设置中有一个异步代理 RL 训练管道,可以最大化吞吐量并支持长视距任务。

 

Zhipu AI 报告称,在涵盖代理任务、推理和编码的 12 个基准测试的综合排名中,GLM-4.5 位列第三,仅次于最顶级模型 OpenAI 和 Anthropic。GLM-4.5-Air 排名第六,超过了许多类似或规模更大的模型。


图片来源:Zhipu AI 博客

 

GLM-4.5 在编码基准测试中表现特别强势。它在 SWE-bench Verified 上达到了 64.2%,在 TerminalBench 上达到了 37.5%,这使得它在多个指标上领先于 Claude 4 Opus、GPT-4.1 和 Gemini 2.5 Pro。其工具调用成功率达到了 90.6%,超过了 Claude-4-Sonnet(89.5%)和 Kimi K2(86.2%)。

 

早期测试者对 GLM-4.5 的编码和代理能力给予了高度评价。一位 Reddit 用户分享道:

 

从初步比较来看,这些模型似乎非常好。GLM-4.5 在编码任务上似乎非常出色,而在我的代理研究和摘要基准测试中,GLM-4.5-Air 似乎比 Qwen 3 235B-a22b 2507 更好。

 

还有一位用户对 GLM 系列的速度和语言熟练度发表了看法:

 

GLM 令人印象非常深刻。我还没有尝试 4.5,但 4.1 Thinking Flash 在 Scolarius 的法语语言测试中得分约为 150/200——在我个人比较过的 19 个 LLM 中是最好的模型之一。速度也极快。

 

GLM-4.5 可以通过 Z.ai 直接使用,也可以通过Z.ai API调用,或集成到现有的编码代理工具如 Claude Code 或 Roo Code 中。Hugging Face和 ModelScope 提供了本地部署的模型权重,支持 vLLM 和 SGLang 推理框架。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:

https://www.infoq.com/news/2025/08/glm-4-5/

2025-08-08 16:008076

评论

发布
暂无评论

质性数据分析软件 ATLAS.ti 8下载 ATLAS.ti 8 mac中文破解版

Rose

Ableton Live 12 mac中文完美破解版 附Live12激活文件 支持M/intel

Rose

汇点成线,连接世界——福田区点线世界综合服务平台打造投资推广与企业服务新标杆

极客天地

数据安全之路:Databend 用户与角色管理应用

Databend

大数据

archicad 27破解版下载 Mac 3D建模软件

Rose

Swinsian for Mac永久破解版 苹果电脑音乐管理播放器

Rose

前端代码规范系列,今天聊聊代码注释

秃头小帅oi

提升法律文书起草效率:AlphaGPT 助力律师快速生成诉讼和仲裁文件

科技汇

今日分享丨浅谈DevOps工具链

inBuilder低代码平台

#DevOps #技术分享

JustStream PRO for Mac(投屏软件)v2.9激活版

Rose

Parallels Desktop 19最新注册使用教程,永久使用,亲测有效~

Rose

实例讲解昇腾 CANN YOLOV8 和 YOLOV9 适配

华为云开发者联盟

软件开发 华为云 昇腾CANN 华为云开发者联盟 企业号2024年4月PK榜

合合信息分享数据资产管理经验,释放数据要素价值,发展新质生产力

合合技术团队

合合信息 大数据场景实践 数据资产管理

袋鼠云春季发布会圆满落幕,构建Data+AI新质生产力

袋鼠云数栈

大数据 AI 数字化转型 大模型 +AI

ETL中如何运用好MQ消息集成

谷云科技RestCloud

数据同步 ETL 数据集成工具 mq消息集成

鸿蒙App开发的几种方式

Onegun

鸿蒙 鸿蒙系统

ApowerREC for mac(多功能屏幕录屏工具)v1.2.7.10激活版

Rose

CLion 2024激活码 v2024.1 RC中文版详细图文安装教程

Rose

dmgArchiver for mac(简单易用的压缩存档软件)v2024.2激活版

Rose

HoudahGeo 6新功能,gps定位 HoudahGeo mac注册破解版

Rose

开发者手机AI - 目标识别demo

Laval小助手

知识图谱的演进与基于 OpenSPG+TuGraph 的推理实践

可信AI进展

参与 PenPad Season 2 获得勋章,还有海量 Scroll 生态稀缺权益

加密眼界

GLM-4.5发布,具有强大的推理、编码和代理能力_AI&大模型_InfoQ精选文章