写点什么

阿里通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens

  • 2024-05-21
    北京
  • 本文字数:1268 字

    阅读完需:约 4 分钟

大小:680.74K时长:03:52
阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens

5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400,击穿全球底价。


 

Qwen-Long 是通义千问的长文本增强版模型,性能对标 GPT-4,上下文长度最高达 1 千万。除了输入价格降至 0.0005 元/千 tokens,Qwen-Long 输出价格也直降 90%至 0.002 元/千 tokens。

 

相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。

 

 

通义千问本次降价共覆盖 9 款商业化及开源系列模型:

 

  • 通义千问商业化模型:Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max;

  • 通义千问开源模型:Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。


其中,不久前发布的通义千问旗舰款大模型 Qwen-Max,API 输入价格降至 0.04 元/千 tokens,降幅达 67%。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo,并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

 

 

业界普遍认为,随着大模型性能逐渐提升,AI 应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

 

“公共云+API”企业大模型主流应用方式

 

在武汉 AI 智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

 

刘伟光认为,不管是开源模型还是商业化模型,公共云+API 将成为企业使用大模型的主流方式。

 

首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。

 

刘伟光介绍,阿里云可以从模型自身和 AI 基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

 

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

 

其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。

 

刘伟光表示,阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

 

最后,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。

 

刘伟光表示,阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

 

2024-05-21 14:185286

评论

发布
暂无评论
发现更多内容

域名解析常见问题:什么是NS记录?域名解析更换NS多久生效?

国科云

标准、高效的管理测试用例和活动

测试人

软件测试

一体机场景ceph高可用介绍

天翼云开发者社区

云计算 Ceph

《深入浅出Apache Spark》系列②:Spark SQL原理精髓全解析

数新网络官方账号

sql

Axure RP 10 for Mac中文汉化版 附Axure RP 10 永久激活码

Rose

PPSSPPSDL for mac(PSP游戏模拟器)附PSP游戏安装包 v1.17.1激活版

Rose

一文彻底弄懂JUC工具包的CountDownLatch的设计理念与底层原理

不在线第一只蜗牛

Java 算法

RAW镜像格式介绍

天翼云开发者社区

云计算 虚拟化 raw

谈谈零信任

天翼云开发者社区

ssl 零信任

云手机群控和传统群控有什么区别?

Ogcloud

云手机 海外云手机 云手机群控 手机群控

BOM是什么?怎么创建BOM?BOM有什么分类?

积木链小链

ERP BOM ERP软件

OpenAI 再发 Sora 新短片,传 Sora 两周内推出;李飞飞团队出品空间智能版 ImageNet丨 RTE 开发者日报

声网

外贸货币汇率转换解决方案

幂简集成

API 货币兑换API

苹果电脑鼠标键盘捕捉工具 Macro Recorder Enterprise for mac

Rose

电池保养管理及续航提升工具 Endurance Mac破解版

Rose

Maxon Cinema 4D R25中文破解版(c4d安装教程)-Mac&win

Rose

SmartSVN 11 Mac破解版 SVN客户端Mac软件安装

Rose

易于使用的多连接数据库管理工具 Navicat Premium 16 Mac中文包

Rose

好用的延迟摄影后期渲染工具 LRTimelapse Pro 7详细功能介绍

Rose

macOS免费好用的硬盘测速工具 Blackmagic Disk Speed Test

Rose

3D渲染和动画制作 Luxion KeyShot2023下载+Luxion KeyShot2023破解教程

Rose

Hive on Spark实战:深入理解与配置Spark集群

敏捷调度TASKCTL

scala MySQL hadoop hive jdk

豆包MarsCode 不允许你还没有女朋友

TRAE

程序员 AI 开发 程序

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens_AI&大模型_褚杏娟_InfoQ精选文章