写点什么

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

  • 2025-02-27
    北京
  • 本文字数:788 字

    阅读完需:约 3 分钟

大小:407.58K时长:02:19
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。


据悉,区别于 Deepseek R1、混元 T1 等需要“想一下再回复”的慢思考模型,混元 Turbo S 能够实现“秒回”,吐字速度提升一倍,首字时延降低 44%,另外,通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

 

在业界通用的多个公开 Benchmark 上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5 等业界领先模型的效果表现。

 



*表格中,其它模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台

 

据介绍,通过长短思维链融合,腾讯混元 Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进理科推理能力,实现模型整体效果提升。

 

架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。新的融合模式也突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题,一方面发挥了 Mamba 高效处理长序列的能力,也保留 Transformer 擅于捕捉复杂上下文的优势,构建了显存与计算效率双优的混合架构,这是工业界首次成功将 Mamba 架构无损地应用在超大型 MoE 模型上。

 

腾讯表示,作为旗舰模型,Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线。腾讯混元表示,正式版的腾讯混元 T1 模型 API 也将很快上线,对外提供接入服务。

 

当前,开发者和企业用户可以在腾讯云上通过 API 调用腾讯混元 Turbo S,即日起一周内免费试用。定价上,Turbo S 输入价格为 0.8 元/百万 tokens,输出价格为 2 元/百万 tokens,相比前代混元 Turbo 模型价格下降数倍。

 

2025-02-27 18:0710127

评论

发布
暂无评论

高级UI强行进阶:自定义View实现女朋友欲罢不能的网易云音乐宇宙尘埃特效,拿去装笔不用谢~

android 程序员 移动开发

架构实战营模块三作业

孙志强

架构实战营

高仿知乎日报无限轮播图+指示符切换动画效果

android 程序员 移动开发

在线文本转2-36任意进制工具

入门小站

工具

毕业总结

babos

#架构实战营

Scrum Master们,难道每天都在摸鱼

华为云开发者联盟

摸鱼 敏捷教练 开发团队 Scrum Master 领导

[ CloudWeGo 微服务实践 - 06 ] 服务发现(2)

baiyutang

golang 微服务 11月日更

模块九—电商秒杀系统

babos

#架构实战营

从0-1教你利用服务器做属于自己的个人博客

坚果

git 博客 服务器 nodejs 11月日更

vivo 全球商城:商品系统架构设计与实践

vivo互联网技术

软件架构 架构设计 商城项目

外包学生管理系统的架构

胡颖

极复杂编码,下载《原神》角色高清图、中日无损配音,爬虫 16 / 120 例

梦想橡皮擦

11月日更

【Flutter 专题】15 图解 ListView 异步加载数据与 Loading 等待

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 11月日更

【Promise 源码学习】第一篇 - Promise 简介

Brave

源码 Promise 11月日更

开源应用中心|最好用的5款开源论坛软件,你知道吗?

开源 博客 开源软件 论坛

MySQL 默认隔离级别是RR,为什么阿里这种大厂会改成RC?

Hollis

CSS响应式布局之REM(二)

Augus

CSS 11月日更

鸿洋:拖不得了,Android11真的要来了,最全适配实践指南奉上

android 程序员 移动开发

linux之我常用的20条命令( 之三)

入门小站

Linux

微信朋友圈复杂度分析

豪毅

架构实战营

dart系列之:dart语言中的内置类型

程序那些事

flutter dart 程序那些事 11月日更

基于软件分析的智能化开发新型服务与技术

华为云开发者联盟

程序员 开发 漏洞 软件分析 智能开发

Java 自定义注解(二)

程序员架构进阶

Java 注解 11月日更

什么是开源软件和自由软件,你真的了解吗

耳东@Erdong

开源软件 11月日更 自由软件

Android C++ 系列:JNI数组操作

轻口味

android 11月日更

Vue进阶(幺陆玖):JS 垃圾回收机制

No Silver Bullet

Vue GC 11月日更

领域驱动设计简介

android 程序员 移动开发

解锁WiFi密码,我只用了60行代码....

Jackpop

如何从 JavaScript 中的数组中删除空元素?

devpoint

JavaScript filter 11月日更

Elastic-Job的执行原理及优化实践

安第斯智能云

Java 架构 分布式 后端

【LeetCode】只出现一次的数字 IIIJava题解

Albert

算法 LeetCode 11月日更

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线_AI&大模型_褚杏娟_InfoQ精选文章