写点什么

腾讯混元推出首款开源混合推理模型:擅长 Agent 工具调用和长文理解

  • 2025-06-30
    北京
  • 本文字数:1215 字

    阅读完需:约 4 分钟

大小:617.04K时长:03:30
腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解

 6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官网正式上线,支持快速接入部署。

 

开源地址:

Github :https://github.com/Tencent-Hunyuan

HuggingFace:https://huggingface.co/tencent

 

据介绍,这是业界首个 13B 级别的 MoE 开源混合推理模型,基于先进的模型架构,Hunyuan-A13B 表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在 Agent 工具调用和长文能力上有突出表现。



*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

 

对于时下热门的大模型 Agent 能力,腾讯混元建设了一套多 Agent 数据合成框架,接入了 MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让 Agent 在多种环境里进行自主探索与学习,进一步提升了 Hunyuan-A13B 的效果。

 

在长文方面,Hunyuan-A13B 支持 256K 原生上下文窗口,在多个长文数据集中取得了优异的成绩。

 



在实际使用场景中,Hunyuan-A13B 模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加 think/no_think 切换思考模式,在效率和特定任务准确性之间取得平衡。



Hunyuan-A13B 模型对个人开发者较为友好,在严格条件下,只需要 1 张中低端 GPU 卡即可部署。目前,Hunyuan-A13B 已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐是前沿开源模型的 2 倍以上。

 

Hunyuan-A13B 集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

 

预训练环节,Hunyuan-A13B 训练了 20T tokens 的语料,覆盖了多个领域。高质量的语料显著提升了模型通用能力。此外,在模型架构上,腾讯混元团队通过系统性分析,建模与验证,构建了适用于 MoE 架构的 Scaling Law 联合公式。这一发现完善了 MoE 架构的 Scaling Law 理论体系,并为 MoE 架构设计提供了可量化的工程化指导,也极大的提升了模型预训练的效果。

 

后训练环节,Hunyuan-A13B 采用了多阶段的训练方式,提升了模型的推理能力,同时兼顾了模型创作、理解、Agent 等通用能力。

 

图:Hunyuan-A13B 后训练四个步骤

 

为更好的提升大语言模型能力,腾讯混元也开源了两个新的数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench 用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,构建了一个包含 1825 个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力;C3-Bench 针对 Agent 场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了 1024 条测试数据,以发现模型能力的不足。

2025-06-30 09:263531

评论

发布
暂无评论

工业4.0|振动分析能做到预防性维护吗?

清水河路人甲

Cordova项目使用Android Studio真机调试

麦洛

android Android Studio 真机调试

IDEA 不为人知的 5 个骚技巧!真香!

王磊

Java 工具 IDEA

这是什么神仙面试宝典?半月看完25大专题,居然斩获阿里P7offer

码哥小胖

Java spring 面试

面试官:反射都不会,还敢说自己会Java?

码农月半

Java 面试 反射 java反射

架构师训练营作业 (第五周)

王海

极客大学架构师训练营

写给大忙人看的内存管理

苹果看辽宁体育

后端 操作系统

架构师训练营 一致性Hash算法Java实现

Cloud.

游戏夜读 | 跟风说一说爬虫

game1night

面试官80%会问的分布式事务中的“最大努力通知”事务

无予且行

Java MySQL 面试 事务

「架构师训练营」第 5 周作业 - 一致性哈希算法

guoguo 👻

极客大学架构师训练营

架构师训练营第 5 周——学习总结

在野

极客大学架构师训练营

没有微服务项目经验,就别去面试官那里送人头了

小谈

Java 架构 面试 微服务 SpringCloud

架构师训练营第5周-一致性hash算法总结及作业

傻傻的帅

极客大学架构师训练营

熟悉JVM吗?为什么新生代内存需要有两个Survivor区?

南南

Java 面试 深入理解JVM JVM原理

老是自以为JVM懂了,那你知道 i = i++和 i = ++i 的区别吗?

小谈

Java 面试 编程语言 JVM 程序

hash一致性算法与优化

Mr.Monkey

超级专家术语学习机

程李文华

解决死锁的4种基本方法(建议收藏)

小吴选手

Java 死锁

如何通过调试学习 nginx ?

张小方

c++ nginx 后端 高性能 服务器端开发

数酒瓶童谣:从99数到0

程李文华

k6简单入门

风中之心

性能测试

对mysql事务的认识,再不懂我就捶死我自己!

你是人间四月天

MySQL 面试 mysql事务

架构师训练营第五周 - 总结

Eric

极客大学架构师训练营

你那么追捧的 SpringBoot,到底替你做了什么?

爱java爱自己

spring

架构师课程第五周 作业

杉松壁

因为我的一个低级错误,生产数据库崩溃了将近半个小时

鄙人薛某

Java MySQL 数据库 故障定位

计算机操作系统基础(十三)---线程同步之读写锁

书旅

php laravel 线程 操作系统 进程

Hash一致性算法的Java实现

wei

深入理解ThreadLocal:拨开迷雾,探究本质

itlemon

源码分析 ThreadLocal

阿里P7岗位面试,面试官问我:为什么HashMap底层树化的标准元素个数是8

鄙人薛某

Java 面试 hashmap 哈希

腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解_AI&大模型_褚杏娟_InfoQ精选文章