写点什么

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

  • 2025-02-27
    北京
  • 本文字数:788 字

    阅读完需:约 3 分钟

大小:407.58K时长:02:19
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。


据悉,区别于 Deepseek R1、混元 T1 等需要“想一下再回复”的慢思考模型,混元 Turbo S 能够实现“秒回”,吐字速度提升一倍,首字时延降低 44%,另外,通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

 

在业界通用的多个公开 Benchmark 上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5 等业界领先模型的效果表现。

 



*表格中,其它模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台

 

据介绍,通过长短思维链融合,腾讯混元 Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进理科推理能力,实现模型整体效果提升。

 

架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。新的融合模式也突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题,一方面发挥了 Mamba 高效处理长序列的能力,也保留 Transformer 擅于捕捉复杂上下文的优势,构建了显存与计算效率双优的混合架构,这是工业界首次成功将 Mamba 架构无损地应用在超大型 MoE 模型上。

 

腾讯表示,作为旗舰模型,Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线。腾讯混元表示,正式版的腾讯混元 T1 模型 API 也将很快上线,对外提供接入服务。

 

当前,开发者和企业用户可以在腾讯云上通过 API 调用腾讯混元 Turbo S,即日起一周内免费试用。定价上,Turbo S 输入价格为 0.8 元/百万 tokens,输出价格为 2 元/百万 tokens,相比前代混元 Turbo 模型价格下降数倍。

 

2025-02-27 18:0710054

评论

发布
暂无评论

基于GIS+WebGL智慧消防3D可视化云控系统

2D3D前端可视化开发

智慧消防 消防物联网云平台 消防三维可视化 智慧消防系统 消防云控平台

行云洞见|为何行业权威都预测“云原生IDE 将成为常态”?

行云创新

ide 云原生 云端IDE Cloud IDE TitanIDE

LeaRun快速开发平台:自由搭建个性化门户

力软低代码开发平台

单线程 Redis 如此之快的 4 个原因

C++后台开发

redis 中间件 后端开发 单线程 C++开发

Studio One2023永久和谐版水果编曲工具使用教程

茶色酒

Studio One 5 Studio One2023

9种跨域方式实现原理

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

实战分享 | 金融数据采集报送平台实践

葡萄城技术团队

OpenHarmony标准系统内核学习【2】CPU轻量级隔离特性

离北况归

OpenHarmony

NFTScan 正式上线 Fantom 网络 NFTScan 浏览器和 NFT API 数据服务

NFT Research

NFT 数据基础设施

聊聊Docker镜像

天翼云开发者社区

Docker 镜像

APISIX Ingress 如何使用 Cert Manager 管理证书

API7.ai 技术团队

证书 api 网关 APISIX Ingress Controller

带你读论文丨S&P21 Survivalism: Living-Off-The-Land 经典离地攻击

华为云开发者联盟

人工智能 华为云 论文 企业号 2 月 PK 榜 华为云开发者联盟

MySQL中的distinct和group by哪个效率更高?

Steven

线上网络丢包引起的接口响应时间过慢,快速排查案例

KINDLING

Java 运维 网络 丢包 eBPF&Linux

SparK 用稀疏掩码为卷积设计 Bert 预训练

Zilliz

计算机视觉

工业生产环境下,时序数据库 TDengine 如何打造全面有效的数字化监控?

TDengine

数据库 tdengine 时序数据库

单线程架构的Redis如此之快的 4 个原因

JAVA旭阳

redis 缓存

CompletableFuture实现异步转同步

FunTester

sun4.0泰山众筹模式项目系统开发技术讲解放哪(Demo)

I8O28578624

如何让OpenHarmony编译速度“狂飙”

离北况归

OpenHarmony

如何通过jstat命令进行查看堆内存使用情况

华为云开发者联盟

后端 开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

理论+实践,教你如何使用Nginx实现限流

华为云开发者联盟

后端 开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

简单概述Serverless

天翼云开发者社区

谈谈我工作中的23个设计模式

阿里巴巴中间件

阿里云 云原生

新年新气象,老兵开新坑

致知Fighting

Java Go 服务器

R2M分布式锁原理及实践

京东科技开发者

redis 框架解析 企业号 2 月 PK 榜 r2m 分布式锁原理

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线_AI&大模型_褚杏娟_InfoQ精选文章