写点什么

仅两小时后,这家国产 GPU 厂宣布支持通义千问 QwQ-32B

  • 2025-03-07
    北京
  • 本文字数:834 字

    阅读完需:约 3 分钟

大小:442.91K时长:02:31
仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B

3 月 6 日,阿里云团队正式开源全新推理模型——通义千问 QwQ-32B。摩尔线程在该模型发布后 2 小时内,迅速且高效完成了对千问 QwQ-32B 的支持。基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署的 QwQ-32B,在实际运行中的推理性能与稳定性均表现优异。



图注:摩尔线程模型广场“夸娥工场”体验界面


摩尔线程将这一成果开放上线至模型广场“夸娥工场”。夸娥工场是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。用户通过访问夸娥工场或点击“阅读原文”,即可体验 QwQ-32B 强大的推理模型性能与创新技术。


夸娥工场体验地址:https://playground.mthreads.com‍‍‍‍‍‍


QwQ-32B 体验地址:https://playground.mthreads.com:12019


千问 QwQ-32B 是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问 QwQ-32B 模型表现异常出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1。尽管该模型仅包含 32B 参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。



图注:官方发布的 benchmark 测试对比图


从官方发布的 benchmark 测试对比图中可以清晰地看到,QwQ-32B 在各项测试中成绩显著高于 OpenAI-o1-mini 及 Deepseek 的各个蒸馏版本。在 LiveBench 与 BFCL 测试中甚至击败了满血版的 Deepseek-R1-671B。


从 DeepSeek 一系列模型的问世,到阿里云通义千问 QwQ-32B 的发布,这些开源大模型降低了开发门槛,激发了开源社区创新活力,极大地推动了 AI 技术的普及与发展。它们用实打实的表现证明,开源大模型凭借其强大的性能和灵活性,正在突破传统技术局限,成为不可阻挡的发展趋势。


摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能 GPU 进行 AI 应用创新。摩尔线程仅用一周时间就火速支持了DeepSeek开源周“全家桶”,对千问 QwQ-32B 更实现了 Day0 级支持,充分验证了摩尔线程先进 MUSA 架构和全功能 GPU 的技术成熟度。


摩尔线程 GitHub 开源社区:https://github.com/MooreThreads

2025-03-07 10:1412629
用户头像
李冬梅 加V:busulishang4668

发布了 1232 篇内容, 共 849.6 次阅读, 收获喜欢 1323 次。

关注

评论

发布
暂无评论

算法训练营 - 学习笔记 - 第九周

心在飞

关于 JavaScript 是否加分号的问题

KooFE

6月日更

react源码解析11.生命周期调用顺序

全栈潇晨

react.js

你真的很忙么?

escray

学习 极客时间 朱赟的技术管理课 6月日更

读深入ES6记[四]

蛋先生DX

ES6 6月日更

平阴玫瑰×浪潮云洲:见证一朵玫瑰的绽放

云计算

欧洲杯发布首座区块链奖杯:中国设计师创作,灵感来源小篆

CECBC

智慧组工系统搭建,组织部干部任免系统

Fork原项目新增分支的同步和推送

Skysper

git

Pandas之:深入理解Pandas的数据结构

程序那些事

Python 数据分析 pandas 程序那些事

Alibaba大佬用了3个月,把Java后端95%的技术体系都整理出来了!

Java架构师迁哥

【Vue2.x 源码学习】第十篇 - 数组数据变化的观测情况

Brave

源码 vue2 6月日更

区块链如何赋能数字城市建设?

CECBC

【21-3】PowerShell 环境

耳东@Erdong

PowerShell Windows Server 6月日更

一文说尽 Linux 系统的 swap 交换空间

看山

Linux 6月日更

MySQL 亿级数据分页的优化

xcbeyond

MySQL 数据库优化 6月日更

百度创新发布“炫瞳活体”技术!起底金融级人脸实名认证方案背后的硬实力

百度大脑

人工智能

☕【JVM技术探索】Class字节码指令方法调用初探

码界西柚

Java JVM 6月日更 字节码指令

MySQL基础之八:外连接

打工人!

myslq 6月日更

跨域背后的故事(一)-----同源策略

卢卡多多

浏览器 同源策略 6月日更

Python——字符串查找/替换/分割

在即

6月日更

时代变了,程序员の老冤家IE浏览器离场啦?!

空城机

JavaScript 微软 大前端 IE 6月日更

5分钟速读之Rust权威指南(二十)

wzx

rust

Kubernetes手记(7)- 控制器配置清单

雪雷

k8s 6月日更

常见词向量模型

Qien Z.

6月日更 词向量 SkipGram 矩阵分解 Glove

5000字 | 详解 Java 中的 21 种锁

悟空聊架构

Java 读写锁 锁升级 6月日更

应对全场景AI框架部署挑战,MindSpore“四招”让你躺平

华为云开发者联盟

深度学习 AI mindspore 算子 ai框架

缓存与数据库的双写一致性

leonsh

MySQL redis 缓存

☕️【Java技术之旅】带你实战使用String的功能特性

码界西柚

Java string 字符串 6月日更

如何在手机上保护自己的隐私?

石云升

隐私保护 数据安全 6月日更

绿色数据时代,全闪存与数据中心的注定邂逅

脑极体

仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B_阿里巴巴_李冬梅_InfoQ精选文章