写点什么

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

  • 2025-02-27
    北京
  • 本文字数:788 字

    阅读完需:约 3 分钟

大小:407.58K时长:02:19
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线

2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。


据悉,区别于 Deepseek R1、混元 T1 等需要“想一下再回复”的慢思考模型,混元 Turbo S 能够实现“秒回”,吐字速度提升一倍,首字时延降低 44%,另外,通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

 

在业界通用的多个公开 Benchmark 上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5 等业界领先模型的效果表现。

 



*表格中,其它模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台

 

据介绍,通过长短思维链融合,腾讯混元 Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进理科推理能力,实现模型整体效果提升。

 

架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。新的融合模式也突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题,一方面发挥了 Mamba 高效处理长序列的能力,也保留 Transformer 擅于捕捉复杂上下文的优势,构建了显存与计算效率双优的混合架构,这是工业界首次成功将 Mamba 架构无损地应用在超大型 MoE 模型上。

 

腾讯表示,作为旗舰模型,Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线。腾讯混元表示,正式版的腾讯混元 T1 模型 API 也将很快上线,对外提供接入服务。

 

当前,开发者和企业用户可以在腾讯云上通过 API 调用腾讯混元 Turbo S,即日起一周内免费试用。定价上,Turbo S 输入价格为 0.8 元/百万 tokens,输出价格为 2 元/百万 tokens,相比前代混元 Turbo 模型价格下降数倍。

 

2025-02-27 18:079692

评论

发布
暂无评论

当达索仿真遇上DeepSeek:AI给工程研发装上了"智慧大脑"

思茂信息

abaqus DeepSeek SIMULIA CST Studio Suite 达索

如何组织一场成功的云会议?华为云Flexus云会议让会议更加轻松高效

轶天下事

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

阿里云大数据AI技术

人工智能 阿里云 LLM Qwen DistilQwen2.5

信创生态新突破:嘉为蓝鲸OpsPilot携手昇思重构智能运维体系

嘉为蓝鲸

运维 嘉为蓝鲸 #WeOps

《Operating System Concepts》阅读笔记:p258-p271

codists

操作系统

鸿蒙APP性能优化

北京木奇移动技术有限公司

APP开发 软件外包公司 APP外包公司

首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准

科技热闻

RocketMQ:消息发送机制

葛飞

零代码!快速搭建你的专属论文阅读助手|火山方舟零代码智能体教程

火山引擎开发者社区

打破云会议技术壁垒!华为云Flexus云会议轻松解决中小企业协作难题

轶天下事

官网购买、注册即用!华为云Flexus云会议让云上沟通更高效

轶天下事

AI赋能的春天!嘉为蓝鲸3.13发布DeepSeek加持研运新品

嘉为蓝鲸

产品发布 嘉为蓝鲸 DeepSeek

OCAI + DeepSeek满血版双buff加成,OS运维从此告别焦虑

OpenCloudOS

AI OpenCloudOS 社区 DeepSeek

Sandisk闪迪携UFS 4.1存储解决方案亮相CFMS | MemoryS 2025

Geek_2d6073

黑龙江等级保护测评到底该不该每年都做?

黑龙江陆陆信息测评部

字节跳动 EB 级日志系统设计与优化实践

火山引擎开发者社区

从人工到智能:DeepSeek重新定义告警管理效能标准

嘉为蓝鲸

运维 AIOPS 告警管理 DeepSeek

专访金融时报中文网总编:你怎么看 Crypto?

TechubNews

crypto 加密市场 市场趋势

嘉为蓝鲸深度参与国家DOMM标准实战培训体系构建

嘉为蓝鲸

嘉为蓝鲸 一体化运维 DOMM

从古籍到算法,数智本草大模型背后的研发之路

华为云开发者联盟

人工智能 盘古大模型 大模型

广大中小企业的共同选择!华为云Flexus云会议引领云上协作新潮流

轶天下事

多种设备皆可联接!华为云Flexus云会议开箱即用、轻松上手

轶天下事

高清、高效、高性价比,华为云Flexus云会议专为中小企业而生!

轶天下事

从曼哈顿到龙隐洞天,XeSS 助你决胜游戏战场

E科讯

电机行业MES系统功能介绍及实施方案

万界星空科技

mes 万界星空科技mes 电机行业 电机MES 电机工厂

字节跳动冯佳时:大语言模型在计算机视觉领域的应用、问题和我们的解法

Geek_2d6073

腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线_AI&大模型_褚杏娟_InfoQ精选文章