即刻成为鸿蒙应用开发者,解锁职业发展新机遇!点击了解~ 了解详情
写点什么

阿里通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens

  • 2024-05-21
    北京
  • 本文字数:1268 字

    阅读完需:约 4 分钟

大小:680.74K时长:03:52
阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens

5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400,击穿全球底价。


 

Qwen-Long 是通义千问的长文本增强版模型,性能对标 GPT-4,上下文长度最高达 1 千万。除了输入价格降至 0.0005 元/千 tokens,Qwen-Long 输出价格也直降 90%至 0.002 元/千 tokens。

 

相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。

 

 

通义千问本次降价共覆盖 9 款商业化及开源系列模型:

 

  • 通义千问商业化模型:Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max;

  • 通义千问开源模型:Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。


其中,不久前发布的通义千问旗舰款大模型 Qwen-Max,API 输入价格降至 0.04 元/千 tokens,降幅达 67%。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo,并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

 

 

业界普遍认为,随着大模型性能逐渐提升,AI 应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

 

“公共云+API”企业大模型主流应用方式

 

在武汉 AI 智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

 

刘伟光认为,不管是开源模型还是商业化模型,公共云+API 将成为企业使用大模型的主流方式。

 

首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。

 

刘伟光介绍,阿里云可以从模型自身和 AI 基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

 

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

 

其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。

 

刘伟光表示,阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

 

最后,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。

 

刘伟光表示,阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

 

2024-05-21 14:185146

评论

发布
暂无评论
发现更多内容

最好的 6 个 React Table 组件详细亲测推荐

蒋川

React

你了解部署流水线吗?

华为云开发者联盟

自动化 软件开发 devcloud 部署流水线 流水线

如何在新公司快速落地

Hockor

Redis:在windows环境安装Redis

喀拉峻

redis

Redis集群架构剖析(3):集群处理redis-cli指令

非晓为骁

redis 架构 分布式 redis cluster

Kubernetes API规范:为optional的字段使用pointer

工程师薛昭君

API Kubernetes 集群

HertzBeat赫兹节拍 v1.0.beta.6 发布,Linux监控来啦

TanCloud探云

开源 APM 监控 告警

Jetpack Compose之 在Compose中使用Navigation导航

黄林晴

android Compose JetPack

如何消除代码山中那一大坨参数列表

华为云开发者联盟

代码 软件设计 参数 全局变量 参数列表

FAQ(常见问题)页面的编写技巧

小炮

企业 常见问题 客户服务

计算机编码规则之:Base64编码

程序那些事

Java base64 nio 程序那些事 3月月更

聊聊 C 语言和 ABAP 这两门编程语言的关系

汪子熙

c++ 编程语言 C语言 abap 3月月更

云效DevOps全家桶评测征集令重磅来袭!免费使用云效全套功能

阿里云云效

云计算 阿里云 DevOps 云原生

焕然一新的 Vue 3 中文文档来了

CRMEB

《软件开发的201个原则》思考:4. 高质量软件是可以实现的

非晓为骁

个人成长 软件工程 软件开发

presto是如何保证作业内存不会发生冲突和溢出

华为云开发者联盟

内存 presto 内存计算引擎 System Pool general Pool

Rust的Cow类型

Shine

rust cow

公有云RDS太贵?基于ECS构建的多云RDS服务可降低近半成本

沃趣科技

数据库 公有云 RDS 云数据库RDS for MySQL 云数据库Redis

743 网络延迟时间

好吃不贵

☕️从Java8到Java17的新特性(一):Java8 的新特性

看山

Java java8

WebAssembly技术_JS调用C函数示例_传递参数、方法导出

DS小龙哥

webassembly 3月月更

大数据培训十大Hive调优技巧

@零度

大数据 hive调优

小程序电商微服务设计

唐尤华

架构实战营

RocketMQ的tag还有这个“坑”!

中间件兴趣圈

RocketMQ tag 消息过滤

IOS技术分享| ARCallPlus 开源项目(一)

anyRTC开发者

ios 移动开发 语音通话 视频通话 呼叫邀请

一文搞定 Flutter 底部弹窗实现

岛上码农

flutter 跨平台 ios开发 Android开发 3月月更

深入浅出 Vue3 核心知识点

百瓶技术

Vue 前端 VUE 3.0 源码 vue3.0

昇腾CANN论文上榜CVPR,全景图像生成算法交互性再增强!

华为云开发者联盟

CVPR CANN 图像生成 昇腾AI处理器 图像布局

java培训Redis高频面试考点

@零度

Java redis

DPU芯片头部企业云豹智能加入龙蜥社区,共同推动新一代数据中心基础设施蓬勃发展

OpenAnolis小助手

云计算 开源 芯片 龙蜥社区

5G 和 Wi-Fi 市场与技术的一些思考系列之二

李伟-晨泳

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens_AI&大模型_褚杏娟_InfoQ精选文章