写点什么

仅两小时后,这家国产 GPU 厂宣布支持通义千问 QwQ-32B

  • 2025-03-07
    北京
  • 本文字数:834 字

    阅读完需:约 3 分钟

大小:442.91K时长:02:31
仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B

3 月 6 日,阿里云团队正式开源全新推理模型——通义千问 QwQ-32B。摩尔线程在该模型发布后 2 小时内,迅速且高效完成了对千问 QwQ-32B 的支持。基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署的 QwQ-32B,在实际运行中的推理性能与稳定性均表现优异。



图注:摩尔线程模型广场“夸娥工场”体验界面


摩尔线程将这一成果开放上线至模型广场“夸娥工场”。夸娥工场是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。用户通过访问夸娥工场或点击“阅读原文”,即可体验 QwQ-32B 强大的推理模型性能与创新技术。


夸娥工场体验地址:https://playground.mthreads.com‍‍‍‍‍‍


QwQ-32B 体验地址:https://playground.mthreads.com:12019


千问 QwQ-32B 是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问 QwQ-32B 模型表现异常出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1。尽管该模型仅包含 32B 参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。



图注:官方发布的 benchmark 测试对比图


从官方发布的 benchmark 测试对比图中可以清晰地看到,QwQ-32B 在各项测试中成绩显著高于 OpenAI-o1-mini 及 Deepseek 的各个蒸馏版本。在 LiveBench 与 BFCL 测试中甚至击败了满血版的 Deepseek-R1-671B。


从 DeepSeek 一系列模型的问世,到阿里云通义千问 QwQ-32B 的发布,这些开源大模型降低了开发门槛,激发了开源社区创新活力,极大地推动了 AI 技术的普及与发展。它们用实打实的表现证明,开源大模型凭借其强大的性能和灵活性,正在突破传统技术局限,成为不可阻挡的发展趋势。


摩尔线程积极响应开源社区的号召,旨在赋能更多开发者基于国产全功能 GPU 进行 AI 应用创新。摩尔线程仅用一周时间就火速支持了DeepSeek开源周“全家桶”,对千问 QwQ-32B 更实现了 Day0 级支持,充分验证了摩尔线程先进 MUSA 架构和全功能 GPU 的技术成熟度。


摩尔线程 GitHub 开源社区:https://github.com/MooreThreads

2025-03-07 10:1412553
用户头像
李冬梅 加V:busulishang4668

发布了 1208 篇内容, 共 833.0 次阅读, 收获喜欢 1313 次。

关注

评论

发布
暂无评论

在线网页快捷方式创建工具

入门小站

工具

03 设计模式之工厂模式

陈皮的JavaLib

Java 面试 设计模式 工厂模式 8月日更

停下来读读书

箭上有毒

生活随想 8月日更

Linux之watch命令

入门小站

Linux

缓存数据历险记(一)--被缓存警察上课一天

卢卡多多

redis 缓存 8月日更

12年高级工程师的“飞升之路”

Geek_f90455

Java 程序员 后端

2020-2021阿里巴巴Java面试真题解析

Geek_f90455

Java 程序员 后端

Druid 通过 dsql 进行查询

HoneyMoose

2021Java进阶者的新篇章

JVM调优资料

Java 程序员 后端

2021京东最新Java面试真题解析

JVM调优资料

Java 程序员 后端

我测了啊,我真测了!

QualityFocus

测试 质量保障 线上问题 缺陷

关于 go run 命令执行过程中的“坑坑点点”

liuzhen007

8月日更

2021Java岗面试题知识点小结

Geek_f90455

Java 程序员 后端

2021大厂Java面试最火问题

JVM调优资料

Java 程序员 后端

第一次凡尔赛,字节跳动3面+腾讯6面一次过,谈谈我的大厂面经

编程菌

Java 编程 程序员 面试 计算机

Vue组件通信之ref

Augus

8月日更

2021大厂Java知识点总结

JVM调优资料

Java 程序员 后端

黄金圈法则解读数据中台(1):为什么需要数据中台

水滴

数据中台 黄金圈法则 8月日更

Hbase 入门详解

Se7en

学习的细碎之处

Nydia

JDK 从8升级到11,使用 G1 GC,HBase 性能下降近20%。JDK 到底干了什么?

毕昇JDK社区

2021Java面试笔试总结

JVM调优资料

Java 程序员 后端

2021Java开发现状分析

Geek_f90455

Java 程序员 后端

2021大厂Java开发面试总结+解答

JVM调优资料

Java 程序员 后端

2020-2021华为Java面试真题

Geek_f90455

Java 程序员 后端

DDD领域驱动设计·学习应用·一

小诚信驿站

领域驱动设计 领域驱动模型DDD 中台架构 领域驱动

2020-2021京东Java面试真题解析

Geek_f90455

Java 程序员 后端

2021Java不死我不倒

Geek_f90455

Java 程序员 后端

Druid 通过 dsql 的服务器连接参数如何配置

HoneyMoose

2021Java者未来的出路在哪里

JVM调优资料

Java 程序员 后端

为什么需要数据库连接池

赖猫

MySQL 数据库 后端 连接池

仅两小时后,这家国产GPU厂宣布支持通义千问QwQ-32B_阿里巴巴_李冬梅_InfoQ精选文章