写点什么

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

  • 2025-02-27
    北京
  • 本文字数:788 字

    阅读完需:约 3 分钟

大小:407.58K时长:02:19
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。


据悉,区别于 Deepseek R1、混元 T1 等需要“想一下再回复”的慢思考模型,混元 Turbo S 能够实现“秒回”,吐字速度提升一倍,首字时延降低 44%,另外,通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

 

在业界通用的多个公开 Benchmark 上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5 等业界领先模型的效果表现。

 



*表格中,其它模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台

 

据介绍,通过长短思维链融合,腾讯混元 Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进理科推理能力,实现模型整体效果提升。

 

架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。新的融合模式也突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题,一方面发挥了 Mamba 高效处理长序列的能力,也保留 Transformer 擅于捕捉复杂上下文的优势,构建了显存与计算效率双优的混合架构,这是工业界首次成功将 Mamba 架构无损地应用在超大型 MoE 模型上。

 

腾讯表示,作为旗舰模型,Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线。腾讯混元表示,正式版的腾讯混元 T1 模型 API 也将很快上线,对外提供接入服务。

 

当前,开发者和企业用户可以在腾讯云上通过 API 调用腾讯混元 Turbo S,即日起一周内免费试用。定价上,Turbo S 输入价格为 0.8 元/百万 tokens,输出价格为 2 元/百万 tokens,相比前代混元 Turbo 模型价格下降数倍。

 

2025-02-27 18:0710332

评论

发布
暂无评论

数据库迁移系列】从MySQL到openGauss的数据库对象迁移实践

daydayup

CTO如何帮助业务成功

程序员半支烟

openGauss赋能企业核心场景应用 | 华为全联接大会2022专题回顾

daydayup

openGauss数据库从3.0.0升级到3.1.0操作实践

daydayup

华为阅读看好“短故事”新赛道 签约知乎盐言故事开启轻阅读

最新动态

Go 介绍

小万哥

Go golang 编程语言 跨平台 后端开发

Zebec Payroll :计划推出 WageLink On-Demand Pay,进军薪酬发放领域

西柚子

鸿蒙生态星河璀璨 | 老程序员让HarmonyOS创新从“心”开始

最新动态

openGauss —— 智能优化器之基数估计

daydayup

openGauss内核分析(二.一):简单查询的执行

daydayup

Zebec Payroll :计划推出 WageLink On-Demand Pay,进军薪酬发放领域

股市老人

从价值的角度看,为何 POSE 通证值得长期看好

股市老人

程序员是否适合创业

程序员半支烟

创业 程序员

JDK中「SPI」原理分析

Java 架构 jdk spi

多家合作伙伴与华为终端云服务签约 全面合作共建鸿蒙服务分发新生态

最新动态

HarmonyOS NEXT,生命之树初长成

脑极体

鸿蒙 AI 应用

C++实现对回收站里的文件进行操作

芯动大师

金奖方案 | 一专多能、傲视寰宇,南大通用GBase8c数据库牛在哪里 #openGauss

daydayup

openGauss内核荣获中国首个国际CC EAL4+级别认证

daydayup

Zebec Payroll :计划推出 WageLink On-Demand Pay,进军薪酬发放领域

BlockChain先知

10分钟入门Flink--架构和原理

程序员半支烟

flink

从价值的角度看,为何 POSE 通证值得长期看好

西柚子

openGauss的SQL引擎在3.1.0版本中做了哪些优化?

daydayup

服务端apk打包教程

越长大越悲伤

Java 服务端打apk包

ChatGenTitle:使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

汀丶人工智能

人工智能 自然语言处理 LLM模型

HDC2023|余承东:元服务将卡片式体验带给消费者,加速鸿蒙生态的繁荣

最新动态

openGauss内核分析(二.二):简单查询的执行

daydayup

只凭阿里大牛珍藏的并发编程笔记,我拿下了30K offer!

小小怪下士

Java 编程 程序员 并发编程 高并发

文心一言 VS 讯飞星火 VS chatgpt (71)-- 算法导论7.1 1题

福大大架构师每日一题

福大大架构师每日一题

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线_AI&大模型_褚杏娟_InfoQ精选文章