写点什么

仅两小时后,这家国产 GPU 厂宣布支持通义千问 QwQ-32B

  • 2025-03-07
    北京
  • 本文字数:834 字

    阅读完需:约 3 分钟

大小:442.91K时长:02:31
仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B

3 月 6 日,阿里云团队正式开源全新推理模型——通义千问 QwQ-32B。摩尔线程在该模型发布后 2 小时内,迅速且高效完成了对千问 QwQ-32B 的支持。基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署的 QwQ-32B,在实际运行中的推理性能与稳定性均表现优异。



图注:摩尔线程模型广场“夸娥工场”体验界面


摩尔线程将这一成果开放上线至模型广场“夸娥工场”。夸娥工场是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。用户通过访问夸娥工场或点击“阅读原文”,即可体验 QwQ-32B 强大的推理模型性能与创新技术。


夸娥工场体验地址:https://playground.mthreads.com‍‍‍‍‍‍


QwQ-32B 体验地址:https://playground.mthreads.com:12019


千问 QwQ-32B 是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问 QwQ-32B 模型表现异常出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1。尽管该模型仅包含 32B 参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。



图注:官方发布的 benchmark 测试对比图


从官方发布的 benchmark 测试对比图中可以清晰地看到,QwQ-32B 在各项测试中成绩显著高于 OpenAI-o1-mini 及 Deepseek 的各个蒸馏版本。在 LiveBench 与 BFCL 测试中甚至击败了满血版的 Deepseek-R1-671B。


从 DeepSeek 一系列模型的问世,到阿里云通义千问 QwQ-32B 的发布,这些开源大模型降低了开发门槛,激发了开源社区创新活力,极大地推动了 AI 技术的普及与发展。它们用实打实的表现证明,开源大模型凭借其强大的性能和灵活性,正在突破传统技术局限,成为不可阻挡的发展趋势。


摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能 GPU 进行 AI 应用创新。摩尔线程仅用一周时间就火速支持了DeepSeek开源周“全家桶”,对千问 QwQ-32B 更实现了 Day0 级支持,充分验证了摩尔线程先进 MUSA 架构和全功能 GPU 的技术成熟度。


摩尔线程 GitHub 开源社区:https://github.com/MooreThreads

2025-03-07 10:1412603
用户头像
李冬梅 加V:busulishang4668

发布了 1227 篇内容, 共 843.3 次阅读, 收获喜欢 1320 次。

关注

评论

发布
暂无评论

【Python】面试官:元组列表都分不清,回去等通知pa

謓泽

Python 元组 2月月更

Lyft微服务研发效能提升实践 | 3. 利用覆盖机制在预发环境中扩展服务网格

俞凡

研发效能 大厂实践 2月月更 lyft

模块八

Geek_59dec2

架构训练营模块八作业

zhongwy

01-《生活中的心理学》读书笔记

清凌渡

读书笔记 心理学

2022年第8周-面试二三事

GeekYin

面试 周报

模块八

撿破爛ぃ

架构训练营

基于STM32+ESP8266+华为云IoT设计的健康管理系统

DS小龙哥

2月月更

hive性能调优实战-读书笔记

聚变

hive Hive SQL

XSS练习小游戏和答案参考

喀拉峻

网络安全

卫星商业价值的尽头,谁来善后?

脑极体

架构实战营 4 期第八模块作业

jialuooooo

架构实战营

「架构实战营」模块八《如何设计贴合业务的高性能高可用中间件系统》作业

DaiChen

作业 「架构实战营」 模块八

【安全漏洞】深入剖析CVE-2021-40444-Cabless利用链

H

设计消息队列存储消息数据的 MySQL 表格

AUV

「架构实战营」

模块八-设计消息队列存储消息数据 作业

novoer

「架构实战营」

什么是开源的「第一性原理」?

腾源会

开源 腾源会

2022 ARTS|Week 08

MiracleWong

算法 写作 ARTS 打卡计划

Meta启示:AI是通往元宇宙的关键变量

脑极体

一文入门rollup!13组demo带你轻松驾驭

摸鱼的春哥

前端 vite Rollup webpack 构建

Go 语言入门很简单:Go 如何面向对象

宇宙之一粟

面向对象 Go 语言 2月月更

架构实战营 模块八

架构实战营 「架构实战营」 模块八

极速生成缩略图,Serverless 支撑赛事转播锁定冬奥亮点

阿里巴巴云原生

阿里云 Serverless 云原生 冬奥会 函数计算FC

[架构实战营]模块八 消息队列Mysql表格设计

Vincent

「架构实战营」

工作想法小计(3):2/21 - 2/25

非晓为骁

个人成长 工作

EventBridge消息路由|高效构建消息路由能力

阿里巴巴云原生

阿里云 云原生 消息队列 EventBridge

架构实战营第 4 期 -- 模块八作业

烈火干柴烛灭田边残月

架构实战营

Java线程池进阶

木小风

Java 线程池

Vue3 过10种组件通讯方式

德育处主任

Vue 3 vuex 组件通信 Pinia mitt.js

Thinkphp最新版本漏洞分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

迭代器总结

编程三昧

JavaScript 前端 迭代器 2月月更

仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B_阿里巴巴_李冬梅_InfoQ精选文章