写点什么

腾讯混元推出首款开源混合推理模型:擅长 Agent 工具调用和长文理解

  • 2025-06-30
    北京
  • 本文字数:1215 字

    阅读完需:约 4 分钟

大小:617.04K时长:03:30
腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解

 6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官网正式上线,支持快速接入部署。

 

开源地址:

Github :https://github.com/Tencent-Hunyuan

HuggingFace:https://huggingface.co/tencent

 

据介绍,这是业界首个 13B 级别的 MoE 开源混合推理模型,基于先进的模型架构,Hunyuan-A13B 表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在 Agent 工具调用和长文能力上有突出表现。



*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

 

对于时下热门的大模型 Agent 能力,腾讯混元建设了一套多 Agent 数据合成框架,接入了 MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让 Agent 在多种环境里进行自主探索与学习,进一步提升了 Hunyuan-A13B 的效果。

 

在长文方面,Hunyuan-A13B 支持 256K 原生上下文窗口,在多个长文数据集中取得了优异的成绩。

 



在实际使用场景中,Hunyuan-A13B 模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加 think/no_think 切换思考模式,在效率和特定任务准确性之间取得平衡。



Hunyuan-A13B 模型对个人开发者较为友好,在严格条件下,只需要 1 张中低端 GPU 卡即可部署。目前,Hunyuan-A13B 已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐是前沿开源模型的 2 倍以上。

 

Hunyuan-A13B 集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

 

预训练环节,Hunyuan-A13B 训练了 20T tokens 的语料,覆盖了多个领域。高质量的语料显著提升了模型通用能力。此外,在模型架构上,腾讯混元团队通过系统性分析,建模与验证,构建了适用于 MoE 架构的 Scaling Law 联合公式。这一发现完善了 MoE 架构的 Scaling Law 理论体系,并为 MoE 架构设计提供了可量化的工程化指导,也极大的提升了模型预训练的效果。

 

后训练环节,Hunyuan-A13B 采用了多阶段的训练方式,提升了模型的推理能力,同时兼顾了模型创作、理解、Agent 等通用能力。

 

图:Hunyuan-A13B 后训练四个步骤

 

为更好的提升大语言模型能力,腾讯混元也开源了两个新的数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench 用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,构建了一个包含 1825 个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力;C3-Bench 针对 Agent 场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了 1024 条测试数据,以发现模型能力的不足。

2025-06-30 09:267

评论

发布
暂无评论

前端工程师leetcode算法面试必备-二叉树深度广度遍历

js2030code

JavaScript LeetCode

视觉大模型训练和推理加速

Baidu AICLOUD

异构计算 AI加速 云原生AI 百度百舸

细数华为云云原生产品及五大开源实践

华为云开发者联盟

云计算 云原生 后端 华为云 企业号 1 月 PK 榜

深度解读天翼云紫金DPU,软硬协同造就极致性能!

天翼云开发者社区

2022 倒带 - NutUI

京东科技开发者

小程序 开源 开发 技术栈 企业号 1 月 PK 榜

【深入浅出Sentinel原理及实战】「基础实战专题」零基础探索分析Sentinel控制台开发指南(3)

码界西柚

sentinel sentinel集群限流 1月日更

从开源安全看汽车安全新挑战

安势信息

开源安全 汽车安全 SBOM 开源漏洞 清源CleanSource SCA

《SBOM: 提高软件供应链透明度的关键》重磅白皮书来袭

安势信息

SCA SBOM 清源CleanSource SCA 安势信息 开源软件供应链安全

《迷你世界》亿级玩家都在用的游戏场景推荐系统长啥样?

华为云开发者联盟

数据库 后端 华为云 企业号 1 月 PK 榜

性能测试技术笔记(一):如何快速上手压测工作

老张

性能测试

重磅发布!《天翼云白皮书》+天翼云紫金DPU来了!

天翼云开发者社区

CDN 系统

2022 年,这 20+22 位共建者闪耀 StarRocks 社区

StarRocks

数据库 开源

开源共创,StarRocks 祝您 2023 年前 “兔” 无量!

StarRocks

数据库 开源

鲸品堂:2023你好

鲸品堂

技术人

构建api gateway - 序与目录

八苦-瞿昙

Gateway API Gateway build api gateway

使用QuTrunk+AWS ParallelCluster3进行并行计算

启科量子开发者官方号

量子计算

袋鼠云产品功能更新报告03期丨产品体验全面优化,请查收!

袋鼠云数栈

大数据

Polaris 和 dubbogo 全面对接,让微服务更简单

阿里巴巴云原生

阿里云 云原生 dubbogo

什么是A/B实验,为什么要开A/B实验?

字节跳动数据平台

大数据 AB testing实战

天翼账号网关系统架构演进历程

Sean Chen

高并发 API网关 Kong 网关 天翼账号 网关演进

如何看待PyTorch 2.0?

OneFlow

人工智能 深度学习 PyTorch

阿里云专有云重磅亮相中国信通院2022混合云技术发展论坛

云布道师

阿里云 混合云

“新范式”——2022创业邦100未来独角兽峰会暨创业邦年会圆满落幕

创业邦

互联网一线研发管理之殇

葱小白

互联网 管理 前端

手把手带你开发starter,点对点带你讲解原理

京东科技开发者

spring 开发 服务器 系统 企业号 1 月 PK 榜

大咖说·阿里云瑶池|电商业务与数据库技术发展的双向奔赴

大咖说

数据库 电商

音视频开发进阶|第七讲:分辨率与帧率·上篇

ZEGO即构

专注软件供应链安全,「安势信息」完成数千万元级别Pre-A轮融资

安势信息

开源安全 开源软件供应链 安势信息 Pre-A轮融资 开源软件供应链安全

邮箱中的Qt线程设计

统信软件

邮箱 邮箱系统

解密秒杀系统架构:不是所有的秒杀都是秒杀

华为云开发者联盟

后端 开发 华为云 企业号 1 月 PK 榜

腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解_AI&大模型_褚杏娟_InfoQ精选文章