写点什么

仅两小时后,这家国产 GPU 厂宣布支持通义千问 QwQ-32B

  • 2025-03-07
    北京
  • 本文字数:834 字

    阅读完需:约 3 分钟

大小:442.91K时长:02:31
仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B

3 月 6 日,阿里云团队正式开源全新推理模型——通义千问 QwQ-32B。摩尔线程在该模型发布后 2 小时内,迅速且高效完成了对千问 QwQ-32B 的支持。基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署的 QwQ-32B,在实际运行中的推理性能与稳定性均表现优异。



图注:摩尔线程模型广场“夸娥工场”体验界面


摩尔线程将这一成果开放上线至模型广场“夸娥工场”。夸娥工场是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。用户通过访问夸娥工场或点击“阅读原文”,即可体验 QwQ-32B 强大的推理模型性能与创新技术。


夸娥工场体验地址:https://playground.mthreads.com‍‍‍‍‍‍


QwQ-32B 体验地址:https://playground.mthreads.com:12019


千问 QwQ-32B 是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问 QwQ-32B 模型表现异常出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1。尽管该模型仅包含 32B 参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。



图注:官方发布的 benchmark 测试对比图


从官方发布的 benchmark 测试对比图中可以清晰地看到,QwQ-32B 在各项测试中成绩显著高于 OpenAI-o1-mini 及 Deepseek 的各个蒸馏版本。在 LiveBench 与 BFCL 测试中甚至击败了满血版的 Deepseek-R1-671B。


从 DeepSeek 一系列模型的问世,到阿里云通义千问 QwQ-32B 的发布,这些开源大模型降低了开发门槛,激发了开源社区创新活力,极大地推动了 AI 技术的普及与发展。它们用实打实的表现证明,开源大模型凭借其强大的性能和灵活性,正在突破传统技术局限,成为不可阻挡的发展趋势。


摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能 GPU 进行 AI 应用创新。摩尔线程仅用一周时间就火速支持了DeepSeek开源周“全家桶”,对千问 QwQ-32B 更实现了 Day0 级支持,充分验证了摩尔线程先进 MUSA 架构和全功能 GPU 的技术成熟度。


摩尔线程 GitHub 开源社区:https://github.com/MooreThreads

2025-03-07 10:1410531
用户头像
李冬梅 加V:busulishang4668

发布了 1034 篇内容, 共 647.9 次阅读, 收获喜欢 1200 次。

关注

评论

发布
暂无评论

openGauss数据库源码解析系列文章——安全管理源码解析(三)

daydayup

数字鸿沟,让气候脆弱者更脆弱

脑极体

AI气象

想要“收听”物联网/工业物联网专题干货?CommunityOverCode Asia 各票种 Pick 指南!

Apache IoTDB

【我和openGauss的故事】openGauss初体验

daydayup

读:《Google软件工程》 之 “软件工程”

术子米德

软件工程

局域网与Kubernetes内部网络如何互通

程序员半支烟

k8s

从 Zebec Protocol 长期布局看,ZBC 通证的潜在应用场景

西柚子

从 Zebec Protocol 长期布局看,ZBC 通证的潜在应用场景

鳄鱼视界

15. 系统内置模块

茶桁

Python 模块

C++语法中bitset位图介绍及模拟实现

芯动大师

局域网与Kubernetes内部网络如何互通

程序员半支烟

k8s

openGauss数据库源码解析系列文章——安全管理源码解析(四)

daydayup

2023-08-12:用go语言写算法。实验室需要配制一种溶液,现在研究员面前有n种该物质的溶液, 每一种有无限多瓶,第i种的溶液体积为v[i],里面含有w[i]单位的该物质, 研究员每次可以选择一瓶

福大大架构师每日一题

左程云 福大大架构师每日一题

从 Zebec Protocol 长期布局看,ZBC 通证的潜在应用场景

BlockChain先知

【我和openGauss的故事】体验openGauss 5.0极简版一主一备部署,延时回放和主备切换功能

daydayup

【我和openGauss的故事】openGauss 3.1.1企业版主备集群升级至5.0.0操作指南

daydayup

从 Zebec Protocol 长期布局看,ZBC 通证的潜在应用场景

股市老人

【我和openGauss的故事】openGauss5.0企业版集群一主一备安装V1.0

daydayup

【我和openGauss的故事】openGauss主备集群节点的添加与删除

daydayup

一个SAT求解器及其JavaScript实现

Yuet

局域网与Kubernetes内部网络如何互通

程序员半支烟

k8s

对话文本数据的珍贵贡献:训练大模型赋予智能与情感理解

数据堂

读:《Google软件工程》 之 “度量工程”

术子米德

软件工程

【我和openGauss的故事】构建openGauss开发编译提交一体化环境

daydayup

【我和openGauss的故事】kettle连接openGauss 5.0.0 数据库

daydayup

【我和openGauss的故事】openGauss索引推荐功能测试

daydayup

对话文本数据是培养大模型的智能与交流之源

数据堂

仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B_阿里巴巴_李冬梅_InfoQ精选文章