Agentic AI、具身智能、强化学习框架、端侧大模型……来QCon上海站,感受AI的未来! 了解详情
写点什么

仅两小时后,这家国产 GPU 厂宣布支持通义千问 QwQ-32B

  • 2025-03-07
    北京
  • 本文字数:834 字

    阅读完需:约 3 分钟

大小:442.91K时长:02:31
仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B

3 月 6 日,阿里云团队正式开源全新推理模型——通义千问 QwQ-32B。摩尔线程在该模型发布后 2 小时内,迅速且高效完成了对千问 QwQ-32B 的支持。基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署的 QwQ-32B,在实际运行中的推理性能与稳定性均表现优异。



图注:摩尔线程模型广场“夸娥工场”体验界面


摩尔线程将这一成果开放上线至模型广场“夸娥工场”。夸娥工场是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。用户通过访问夸娥工场或点击“阅读原文”,即可体验 QwQ-32B 强大的推理模型性能与创新技术。


夸娥工场体验地址:https://playground.mthreads.com‍‍‍‍‍‍


QwQ-32B 体验地址:https://playground.mthreads.com:12019


千问 QwQ-32B 是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问 QwQ-32B 模型表现异常出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1。尽管该模型仅包含 32B 参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。



图注:官方发布的 benchmark 测试对比图


从官方发布的 benchmark 测试对比图中可以清晰地看到,QwQ-32B 在各项测试中成绩显著高于 OpenAI-o1-mini 及 Deepseek 的各个蒸馏版本。在 LiveBench 与 BFCL 测试中甚至击败了满血版的 Deepseek-R1-671B。


从 DeepSeek 一系列模型的问世,到阿里云通义千问 QwQ-32B 的发布,这些开源大模型降低了开发门槛,激发了开源社区创新活力,极大地推动了 AI 技术的普及与发展。它们用实打实的表现证明,开源大模型凭借其强大的性能和灵活性,正在突破传统技术局限,成为不可阻挡的发展趋势。


摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能 GPU 进行 AI 应用创新。摩尔线程仅用一周时间就火速支持了DeepSeek开源周“全家桶”,对千问 QwQ-32B 更实现了 Day0 级支持,充分验证了摩尔线程先进 MUSA 架构和全功能 GPU 的技术成熟度。


摩尔线程 GitHub 开源社区:https://github.com/MooreThreads

2025-03-07 10:1412452
用户头像
李冬梅 加V:busulishang4668

发布了 1175 篇内容, 共 791.3 次阅读, 收获喜欢 1296 次。

关注

评论

发布
暂无评论

DeepSeek-V3模型对软件测试行业的影响

测吧(北京)科技有限公司

测试

Windows(Win10/Win11) 系统开机自启

玄兴梦影

开机自启

Claude 3.5:向人类般计算机操作的进步

测吧(北京)科技有限公司

测试

优锘科技携手逐际动力,共创数字孪生与具身智能机器人新未来

ThingJS数字孪生引擎

智能机器人 优锘科技

天润融通助力一鸣食品,AI技术实现全渠道客户服务升级

天润融通

沙利文公布2024企业级产品应用竞争力排名,百度智能云第一

新消费日报

从0到1只需“拖一拖”,开发时间按秒算——低代码到底有多牛

JeeLowCode低代码平台

低代码开发 低代码前端 低代码,

CAD图纸分割与布局导出功能怎么用?

在路上

cad cad看图 CAD看图王

中微公司发明专利再获中国专利奖殊荣

新消费日报

垂类大模型 | 领域专家:更高维度的认知参与

澳鹏Appen

模型幻觉 垂类大模型 领域专家

见证广州地铁11号线开通:30个智慧公厕点亮城市新风貌

光明源智慧厕所

解读智慧厕所的环保与高效双重优势,助力可持续城市建设

光明源智慧厕所

唯品会API接口深度解析:商品详情与关键词搜索的高效应用

代码忍者

智慧厕所如何颠覆传统公共设施?功能与价值全面解析

光明源智慧厕所

DolphinScheduler自身容错导致的服务器持续崩溃重大问题的排查与解决

白鲸开源

大数据 开源 Apache DolphinScheduler 任务调度

作业帮的一二面,难度不逊于各大厂

王中阳Go

面试

微店API接口详解:如何高效获取商品详情及简短代码示例

代码忍者

第一!天翼云全面领跑智算云服务市场

天翼云开发者社区

云计算 云服务 天翼云

点赞!TeleDB入选2024大数据星河案例!

天翼云开发者社区

云计算 大数据 云服务

小白秒变行业专家,天润融通智能客服系统Copilot来帮忙!

天润融通

【最佳实践】蚂蚁基于 MaxCompute 动态过滤器优化小表 JOIN 大表节省70%CPU 消耗

阿里云大数据AI技术

大数据 最佳实践 云原生 MaxCompute

阿里巴巴1688 API接口深度解析:如何高效获取商品详情与SKU信息

代码忍者

G1原理—G1回收器的分区机制

不在线第一只蜗牛

架构 JVM

预见未来,智控风险:数据驱动风险管控新范式

用友智能财务

数据处理 财会

智慧公厕的定义、核心功能、优势与应用场景

光明源智慧厕所

杭州铭师堂的云原生升级实践

阿里巴巴云原生

阿里云 云原生

业务观测:从定义到场景化分析

乘云数字DataBuff

运维 业务监控

文献解读-Effectiveness of mRNA BNT162b2 COVID-19 vaccine up to 6 months in a large integrated health system in the USA: a retrospect

INSVAST

基因检测 临床试验 生信分析 Sentieon 变异检测

区块链项目外包开发流程

北京木奇移动技术有限公司

区块链技术 软件外包公司 web3开发

国际认可!天翼云合规领域影响力up!

天翼云开发者社区

云计算 天翼云

仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B_阿里巴巴_李冬梅_InfoQ精选文章