阿里通义千问GPT-4级主力模型降价97%，1 块钱200万 tokens_AI&大模型_褚杏娟_InfoQ精选文章



 写点什么

登录/注册



大小：680.74K时长：03:52

阿里通义千问GPT-4级主力模型降价97%，1 块钱200万 tokens

5 月 21 日，阿里云抛出重磅炸弹：通义千问 GPT-4 级主力模型 Qwen-Long，API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens，直降 97%。这意味着，1 块钱可以买 200 万 tokens，相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入，降价后约为 GPT-4 价格的 1/400，击穿全球底价。

Qwen-Long 是通义千问的长文本增强版模型，性能对标 GPT-4，上下文长度最高达 1 千万。除了输入价格降至 0.0005 元/千 tokens，Qwen-Long 输出价格也直降 90%至 0.002 元/千 tokens。

相比之下，国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元，均远高于 Qwen-long。

通义千问本次降价共覆盖 9 款商业化及开源系列模型：

通义千问商业化模型：Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max；
通义千问开源模型：Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。

其中，不久前发布的通义千问旗舰款大模型 Qwen-Max，API 输入价格降至 0.04 元/千 tokens，降幅达 67％。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo，并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

业界普遍认为，随着大模型性能逐渐提升，AI 应用创新正进入密集探索期，但推理成本过高依然是制约大模型规模化应用的关键因素。

“公共云+API”企业大模型主流应用方式

在武汉 AI 智领者峰会现场，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示：“作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

刘伟光认为，不管是开源模型还是商业化模型，公共云+API 将成为企业使用大模型的主流方式。

首先，公共云的技术红利和规模效应，带来巨大的成本和性能优势。

刘伟光介绍，阿里云可以从模型自身和 AI 基础设施两个层面不断优化，追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品，构建了极致弹性的 AI 算力调度系统，结合百炼分布式推理加速引擎，大幅压缩了模型推理成本，并加快模型推理速度。

即便是同样的开源模型，在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例，在阿里云百炼上直接调用 API 每月仅需 600 元，私有化部署的成本平均每月超 1 万元。

其次，云上更方便进行多模型调用，并提供企业级的数据安全保障。

刘伟光表示，阿里云可以为每个企业提供专属 VPC 环境，做到计算隔离、存储隔离、网络隔离、数据加密，充分保障数据安全。目前，阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

最后，云厂商天然的开放性，能为开发者提供最丰富的模型和工具链。

刘伟光表示，阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型，内置大模型定制与应用开发工具链，开发者可以便捷地测试比较不同模型，开发专属大模型，并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务，一站式搞定。

评论

发布

暂无评论

鸿蒙轻内核源码分析：文件系统LittleFS

华为云开发者联盟

鸿蒙文件系统 Flash LittleFS LiteOS-M内核

在阿里，我们如何管理代码分支？

阿里云云效

阿里云 DevOps 云原生研发分支管理

百度APP视频播放中的解码优化

百度性能优化视频

Java11特性-效能翻倍的HttpClient

蜜糖的代码注释

Java 后端技术 2月月更

aPaaS将如何改变软件行业？

华为云开发者联盟

云计算软件软件开发 SaaS aPaaS

推荐学java——Spring与web项目

Spring web idea web web项目 idea spring

盘点冬奥会上的那些“黑科技”，你也可以掌握它！

博文视点Broadview

如何让代码代码管理变的更安全更高效 | 云效开发篇

阿里云云效

阿里云 DevOps 云原生代码管理 Codeup

探秘 k8e：极简 Kubernetes 发行版

Kubernetes 云原生

React Fragment介绍与使用

设备接入服务，看完这篇给你整的明明白白

华为云开发者联盟

物联网 IoT 华为云设备接入服务设备

百度爱番番实时CDP建设实践

新思科技BSIMM评估为安全团队提供“他山之石”

InfoQ_434670063458

汽车新思科技软件定义汽车软件安全 BSIMM评估

阿里巴巴DevOps文化浅谈

阿里云云效

阿里巴巴阿里云 DevOps 云原生研发

Java 字符串常见的操作

分配任务的人才是团队的核心成员

管理限界上下文任务分配

【高并发】一文解密诡异并发问题的第一个幕后黑手——可见性问题

Java 并发编程多线程异步编程精通高并发系列

面试突击20：进程和线程有什么区别？

前端开发之js栈内存和堆内存的区别

JAVA开发堆内存栈内存

大数据开发之运维面试题汇总分享

面试题大数据运维

Ceph核心概念解读

总想做点什么

分布式存储 Ceph 云存储云计算，

Kubernetes HPA 基于 Prometheus 自定义指标的可控弹性伸缩

Kubernetes 弹性 HPA

【架构实战营】模块七：命题作业

「架构实战营」

腾讯员工怒怼加班文化事件：大厂的内卷，小厂有什么资格？

永中软件加入龙蜥社区，共建开源新生态

OpenAnolis小助手

Linux 开源永中

不断突破，稳中求进——我的移动端跨平台开发技术回顾与展望| 社区征文

No Silver Bullet

跨平台移动端新春征文 2月月更

java开发之Spring集成MyBatis知识分享

Java spring mybatis

预约小程序开发笔记一：背景与技术方案的选型

“1天一朵云”，这是如何做到的？

华为云开发者联盟

数字化转型软件架构华为云华为云Stack 全栈云平台

从原理到操作，让你在 APISIX 中代理 Dubbo 服务更便捷

API7.ai 技术团队

微服务网关

如何解决Python项目在VScode中跨文件夹导包问题

IT蜗壳教学 2月月更