50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

腾讯混元推出首款开源混合推理模型:擅长 Agent 工具调用和长文理解

  • 2025-06-30
    北京
  • 本文字数:1215 字

    阅读完需:约 4 分钟

大小:617.04K时长:03:30
腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解

 6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官网正式上线,支持快速接入部署。

 

开源地址:

Github :https://github.com/Tencent-Hunyuan

HuggingFace:https://huggingface.co/tencent

 

据介绍,这是业界首个 13B 级别的 MoE 开源混合推理模型,基于先进的模型架构,Hunyuan-A13B 表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在 Agent 工具调用和长文能力上有突出表现。



*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

 

对于时下热门的大模型 Agent 能力,腾讯混元建设了一套多 Agent 数据合成框架,接入了 MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让 Agent 在多种环境里进行自主探索与学习,进一步提升了 Hunyuan-A13B 的效果。

 

在长文方面,Hunyuan-A13B 支持 256K 原生上下文窗口,在多个长文数据集中取得了优异的成绩。

 



在实际使用场景中,Hunyuan-A13B 模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加 think/no_think 切换思考模式,在效率和特定任务准确性之间取得平衡。



Hunyuan-A13B 模型对个人开发者较为友好,在严格条件下,只需要 1 张中低端 GPU 卡即可部署。目前,Hunyuan-A13B 已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐是前沿开源模型的 2 倍以上。

 

Hunyuan-A13B 集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

 

预训练环节,Hunyuan-A13B 训练了 20T tokens 的语料,覆盖了多个领域。高质量的语料显著提升了模型通用能力。此外,在模型架构上,腾讯混元团队通过系统性分析,建模与验证,构建了适用于 MoE 架构的 Scaling Law 联合公式。这一发现完善了 MoE 架构的 Scaling Law 理论体系,并为 MoE 架构设计提供了可量化的工程化指导,也极大的提升了模型预训练的效果。

 

后训练环节,Hunyuan-A13B 采用了多阶段的训练方式,提升了模型的推理能力,同时兼顾了模型创作、理解、Agent 等通用能力。

 

图:Hunyuan-A13B 后训练四个步骤

 

为更好的提升大语言模型能力,腾讯混元也开源了两个新的数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench 用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,构建了一个包含 1825 个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力;C3-Bench 针对 Agent 场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了 1024 条测试数据,以发现模型能力的不足。

2025-06-30 09:263736

评论

发布
暂无评论

极限抵御DDoS攻击!高防主机守护您的网站安全!

一只扑棱蛾子

高防主机

学到就是赚到!NodeJS 实战系列:个人开发者应该如何选购云服务

不在线第一只蜗牛

node.js 实战开发

大咖直播专场 | 数据库集群方案简介

KaiwuDB

KaiwuDB 数据库集群方案介绍

当AGI遇上能源寡头,会碰撞出什么样的火花?

TE智库

特斯联

KaiwuDB CTO 魏可伟:多模架构 —“化繁为简”加速器

KaiwuDB

数据库 AIOT KaiwuDB 多模架构

DevOps in China:15年来,DevOps在中国经历了什么?

DevOps和数字孪生

嵌入式DevOps

错过直播?快收藏详实回顾!Get「研发效能管理」7 步实践指南与案例剖析

极狐GitLab

gitlab DevSecOps 效能管理 GDAI 蔚来案例

比较Postman和JMeter

Liam

程序员 开发 Jmeter Postman

官宣!菁英实习生计划启动,百度大模型团队诚邀你的加入

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

IT安全运维管理系统哪个好?适合中小企业的哪款好?

行云管家

云计算 IT运维 云管理 安全运维

GitLab 入选 Forrester Wave™️ 集成软件交付平台,并获评唯一「领导者」!

极狐GitLab

领导力 gitlab Forrester Wave 领导者 创新能力

【分久必合】构建下一代前端组件 | 社区征文

小鑫同学

年中技术盘点

十大功能特性,助力开发者玩转API Explorer

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

MobPush 最佳实践:消息重弹

MobTech袤博科技

前端 后端 开发者工具 开发 开发工具

继长白山历史文化园三园一区后,鼎益丰再造龙狮谷新项目

极客天地

RisingWave 1.0 版本正式发布!

吴英骏

数据库 rust 云原生 数据架构 流处理

初窥低代码 | 社区征文

神木鼎

低代码 年中技术盘点

无代码落地进企业,轻流不断扩大交友圈

ToB行业头条

软件测试/测试开发丨Selenium 安装教程

测试人

Python 程序员 软件测试 selenium

新增华为高阶智驾+大五座版本!全新问界M7工信部曝光

极客天地

低代码技术:提高效率降低成本的全新选择

互联网工科生

软件开发 低代码 应用程序

智能合约编写高级篇(一)获取区块时间

BSN研习社

IoT 场景下 TDengine 与老牌时序数据库怎么选?看看这份TSBS报告

爱倒腾的程序员

数据库·

AIGC:新AI时代,推动数字人进化的引擎

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 7 月 PK 榜

高效运营新纪元:智能化华为云Astro低代码重塑组装式交付

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

开发者的秘密武器:人工智能与开发工具的完美结合

知者如C

腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解_AI&大模型_褚杏娟_InfoQ精选文章