写点什么

仅两小时后,这家国产 GPU 厂宣布支持通义千问 QwQ-32B

  • 2025-03-07
    北京
  • 本文字数:834 字

    阅读完需:约 3 分钟

大小:442.91K时长:02:31
仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B

3 月 6 日,阿里云团队正式开源全新推理模型——通义千问 QwQ-32B。摩尔线程在该模型发布后 2 小时内,迅速且高效完成了对千问 QwQ-32B 的支持。基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署的 QwQ-32B,在实际运行中的推理性能与稳定性均表现优异。



图注:摩尔线程模型广场“夸娥工场”体验界面


摩尔线程将这一成果开放上线至模型广场“夸娥工场”。夸娥工场是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。用户通过访问夸娥工场或点击“阅读原文”,即可体验 QwQ-32B 强大的推理模型性能与创新技术。


夸娥工场体验地址:https://playground.mthreads.com‍‍‍‍‍‍


QwQ-32B 体验地址:https://playground.mthreads.com:12019


千问 QwQ-32B 是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问 QwQ-32B 模型表现异常出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1。尽管该模型仅包含 32B 参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。



图注:官方发布的 benchmark 测试对比图


从官方发布的 benchmark 测试对比图中可以清晰地看到,QwQ-32B 在各项测试中成绩显著高于 OpenAI-o1-mini 及 Deepseek 的各个蒸馏版本。在 LiveBench 与 BFCL 测试中甚至击败了满血版的 Deepseek-R1-671B。


从 DeepSeek 一系列模型的问世,到阿里云通义千问 QwQ-32B 的发布,这些开源大模型降低了开发门槛,激发了开源社区创新活力,极大地推动了 AI 技术的普及与发展。它们用实打实的表现证明,开源大模型凭借其强大的性能和灵活性,正在突破传统技术局限,成为不可阻挡的发展趋势。


摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能 GPU 进行 AI 应用创新。摩尔线程仅用一周时间就火速支持了DeepSeek开源周“全家桶”,对千问 QwQ-32B 更实现了 Day0 级支持,充分验证了摩尔线程先进 MUSA 架构和全功能 GPU 的技术成熟度。


摩尔线程 GitHub 开源社区:https://github.com/MooreThreads

2025-03-07 10:1412575
用户头像
李冬梅 加V:busulishang4668

发布了 1223 篇内容, 共 837.4 次阅读, 收获喜欢 1316 次。

关注

评论

发布
暂无评论

能源区块链研究|中国内蒙古自治区为减少能源消耗 禁止比特币采矿

CECBC

比特币

SpringBoot启用HTTPS

黄敏

jdk https openssh springboot

Elasticsearch Mapping Root Object

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

面向业务的高可用架构设计

架构精进之路

架构设计 七日更 3月日更

Java安装教程

Sakura

28天写作 3月日更

Linux时间同步-NTP服务器

黄敏

Linux ntp

(28DW-S8-Day15) 在线教育的MOT

mtfelix

在线教育 28天写作 峰值体验 关键时刻 MOT

面试官就是这么欺负人:new Object()到底占用几个字节?

xcbeyond

Java java对象分析 3月日更

如何让别人访问到你的本地项目? Ngrok免费实现内网穿透

xiezhr

ngrok 内网穿透 3月日更

springboot 2.4.0 knife4j 3.0.1接口文档框架

黄敏

springboot SpringBoot 2 Knife4j

JVM笔记 -- JVM的发展以及基于栈的指令集架构

秦怀杂货店

JVM JVM笔记

【LeetCode】分割回文串Java题解

Albert

算法 LeetCode 28天写作

超干货 (实战经验)结合公司业务分析离线数仓建设实践

五分钟学大数据

大数据 数据仓库 28天写作 3月日更

专访 | 我与毕玄的对话

九叔(高翔龙)

Java 阿里巴巴 中间件 架构师 访谈录

常用工具幕布高级会员获取

白贺BaiHe

在有限的时间里,拿到通才的帐号,登入无限的游戏。

叶小鍵

35万一枚的比特币,家里电脑想挖一枚要多长时间?答案只有3个字

CECBC

比特币

程序员之禅(五)十条准则

每天读本书

读书笔记 每天读本书

正则表达式.02 - 量词与贪婪

insight

正则表达式 3月日更

翻译:《实用的Python编程》04_01_Class

codists

Python

旧区块链思维面临淘汰

CECBC

区块链

加快推进数据确权与资产化 发挥区块链技术信用机制优势

CECBC

区块链

关于 Python 中的字符串,我在补充两点,滚雪球学 Python

梦想橡皮擦

Python 28天写作 3月日更

工具软件与开源

行人23

开源 SaaS

IDEA 敏捷开发技巧——实时模版

程序员小航

IDEA IntelliJ IDEA

电商管理系统之发票子系统设计(二)

长沙造纸农

架构设计 高并发系统设计 电商 电子发票 发票

要拥有必先懂失去怎接受——浅谈前景理论

Justin

心理学 28天写作 游戏设计

《精通比特币》学习笔记(第三章)

棉花糖

区块链 学习 3月日更

使用Android版VMware Horizon Client连接到云桌面

梅花鹿鹿

工作中迷迷糊糊,不知道自己想要什么?

一笑

28天写作

文字君和ta的朋友们

InfoQ写作社区官方

仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B_阿里巴巴_李冬梅_InfoQ精选文章