写点什么

没想到国内大模型厂商又一次 high 起来,是因为 OpenAI 断供!

  • 2024-06-26
    北京
  • 本文字数:3275 字

    阅读完需:约 11 分钟

大小:1.58M时长:09:12
没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!

整理 | 褚杏娟、华卫

 

6 月 25 日起,陆续有包括中国大陆在内的各国和相关地区 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的邮件,表示将采取额外措施停止其不支持的地区的 API 使用。

 

根据网上流传的邮件截图,OpenAI 表示:“根据数据显示,你的组织有来自 OpenAl 目前不支持的地区的 API 流量。从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAI 支持的国家、地区名单上的 API 使用。”

 

“要继续使用 OpenAI 的服务,您需要在受支持的地区访问该服务。”在 OpenAI 给出的“支持访问国家和地区”名单上,世界上大部分地区都可以使用 OpenAI,包括几乎整个西方、东欧大部分地区、南亚和大约一半的非洲,但中国大陆、中国香港、俄罗斯、朝鲜、伊朗等地均未在列。

 


而上述不受支持的中国、俄罗斯、朝鲜、伊朗四个国家,似乎“踩在” OpenAI 的雷达上已有一段时间。今年 2 月,这家人工智能公司宣布关闭了其声称由这四个国家的 "国家附属恶意行为者 "使用的账户,表示他们使用 ChatGPT 帮助进行网络钓鱼攻击和开发恶意软件。上个月底,OpenAI 打击了另一组来自中国、俄罗斯、伊朗和以色列的账户。

 

实际上,OpenAI 早先就对中国大陆地区的用户实行了注册门槛,限制了其对 ChatGPT 服务的访问权限。中国大陆的开发者群体在构建基于 OpenAI API 的衍生服务时,往往需要通过代理服务器或在海外部署反向代理机制。这不仅增加了运维成本,也无法保证服务的稳定性。

 

这次,OpenAI 的强制决策一出,便立刻引发了国内大模型厂商的回应,各厂商纷纷表示可以支持企业“无痛”迁移,并发布了不少吸引 OpenAI 用户使用其平台的激励措施。而根据多位行业专业人士的看法和预测,国内大模型行业内部此时也有更深层次的担忧与挑战悄然浮现。

 

“百模大战”

 

首先作出反应的是智谱 AI。当天下午一点半左右,智谱 bigmodel.cn 推出了 OpenAl API 用户特别搬家计划,帮助用户切换至国产大模型,具体包括为开发者提供 1.5 亿 Token(5000 万 GLM-4 +1 亿 GLM-4-Air) 以及从 OpenAl 到 GLM 的系列迁移培训。对于高用量客户,智谱提供与 OpenAl 使用规模对等的 Token 赠送计划(不设上限),以及与 OpenAl 对等的并发规模等。

 


当天下午四点半左右,百度智能云千帆推出了大模型普惠计划,即日起为新注册企业用户提供:

  •  0 元调用:

    文心旗舰模型首次免费,赠送 ERNIE3.5 旗舰模型 5000 万 Tokens 包,主力模型 ERNIE Speed/ERNIE Lite 和轻量模型 ERNIE Tiny 持续免费;

    针对 OpenAI 迁移用户额外赠送与 OpenAI 使用规模对等的 ERNIE3.5 旗舰模型 Tokens 包。

  • 0 元训练:免费模型精调训练服务

  • 0 元迁移:零成本 SDK 迁移工具

  • 0 元服务:专家服务(迁移 &使用指导)

 

不过,百度智能云表示,以上优惠活动均在 2024 年 7 月 25 日 24 点前适用。


不到半小时后,阿里云紧接着宣布,将为 OpenAI API 用户提供最具性价比的中国大模型替代方案,并为中国开发者提供 2200 万免费 tokens 和专属迁移服务。据悉,通义千问主力模型Qwen-plus 在阿里云百炼上的调用价格为 0.004 元/千 tokens,仅为 GPT-4 的 50 分之一。根据斯坦福最新公布的大模型测评榜单 HELM MMLU,Qwen2-72B 得分为 0.824,与 GPT-4 并列全球第四。

 


随后在当天六点 20 分左右,零一万物宣布发起了“Yi API 二折平替计划”,面向 OpenAI 用户推出了平滑迁移至 Yi 系列大模型的服务,并针对接入 OpenAI 的不同模型的用户,一一对应地提供了高模型性能且极具性价比的替换方案。

 


据介绍,目前注册使用 Yi API 的新客户,零一万物立即赠送 100 元额度;平台充值还将赠送 50% 到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受 RPM/TPM 限速直升 Tier3,直达高级别的服务质量和超快响应速度。此外,零一万物 API 还将提供 Prompt 兼容调优服务支持,陪伴用户适配 Yi 系列大模型。

 

零一万物表示,在模型性能相近的同时,Yi-Large 的定价远低于顶配模型 GPT-4o。以 GPT-4o 的定价计算(取 Input 和 Output 均值为 Open API 价格),接入 Yi-Large 后使用成本可下降 72%;而对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上;对于简单任务的处理,Yi-Medium 的使用成本较 GPT-3.5-Turbo-1106 下降 66%。


此外,零一万物还可提供支持实时搜索的 Yi-Large-RAG,适用于需要结合实时信息进行推理的场景,以便用户基于自身需求选择更匹配的模型。

 

当日,AI Infra 厂商硅基流动则直接宣布开放 7 款大模型:SiliconCloud 平台的 Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等开源大模型免费使用。SiliconCloud 是集合主流开源大模型的一站式云服务平台,目前已上架包括 DeepSeek-Coder-V2、Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID 在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud 提供开箱即用的大模型推理加速服务。



当天晚 8 点左右,腾讯云宣布,即日起,新迁移企业用户可免费获得腾讯混元大模型 1 亿 Tokens。目前,腾讯云提供混元 Pro、Standard、Lite 等多个不同版本和尺寸的模型,用户可任意选择。腾讯还将为新迁移企业用户提供免费专属迁移工具和服务,该福利截止 7 月 31 日 24 点前。

 

今日凌晨,百川智能也跟进宣布了“零成本迁移”的措施:免费赠送 1 千万 token、Assistants API 免费使用。另外,百川开设了专家技术群,表示专家随时答疑,五分钟即可完成 API 迁移。


据悉,百川智能前不久刚发布最新一代基座大模型 Baichuan 4,并推出成立之后的首款 AI 助手“百小应”。Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14%和 9%。


一时的机会,更卷的将来


中美之间日益紧张的关系可能是促使 OpenAI 决定打击不受支持的用户的一个因素。自特朗普执政以来,美国已经对中国实施了制裁和关税,包括拜登总统增加对中国芯片、电池和电动汽车的关税。

 

为此,中国也加大了实现技术自给自足的力度,规定其电信公司在 2027 年前停止使用英特尔和 AMD 的 CPU,并要求其汽车制造商在 2025 年前至少在国内采购四分之一的计算机处理器。

 

尽管 OpenAI 正计划阻止在中国的 API 访问,但这对中国公司来说,无疑是一个迅速填补即将到来的市场空白以获得更多用户的好机会。不过,之后国内其他厂商是否会跟进,目前尚不能确定。

 

有专家预测,OpenAI 主动“送生意”的做法,给了国内的大模型厂商喘气的机会,但后续可能就得被迫继续卷价格。这意味着,已经有些降温的“大模型价格战”或将再次“火热”。可以看出,国内大模型行业在机遇重重的同时,竞争也将进一步加剧。

 

正如百川智能 CEO 王小川所说,“我们不需要一千、一万个大模型,在没有价格战的时候,中国可能真的是上百、上千个大模型在进行。”

 

同时,有不少网友纷纷议论:部分国产大模型是否会因 OpenAI 的断服“现原形”。国产大模型中是否存在调用 OpenAI  API 的这一问题暂且不论,目前根据各类大模型用户在公开平台发表的使用反馈来看,许多国产大模型的中文文本上处理能力并不弱于 ChatGPT ,在视频、图片等多模态方面有所不足,但整体来说影响有限。


不可否认的是,对于国内一批使用 OpenAI  API 的开发者来说,影响是巨大的。还有人士对国内用户发出了“谨慎付费”的友善提醒,一些通过调用海外大模型 API 接口来提供服务的套壳网站,之后可能因高昂的站点迁移成本关停跑路。


此外,OpenAI 强制执行其不支持国家列表的访问政策,在对中国开发者产生负面影响的同时,也可能带来其他方面的双向后果。

 

根据 Reddit 上的一篇帖子,总部位于美国的云平台公司 Vercel 的用户如果通过 Vercel 的边缘网络访问 OpenAI,也会收到同样的 OpenAI 邮件。目前还不清楚这封电子邮件是否发送有误,但 Vercel 的边缘网络确实有一个位于香港的区域,与中国大陆一样不受 OpenAI 支持。

2024-06-26 14:339392

评论

发布
暂无评论
发现更多内容

火山引擎+焱融 YRCloudFile,驱动数据存储新增长

焱融科技

云计算 分布式 云原生 高性能 文件存储

百度智能客服斩获 “金音奖—中国最佳客户联络中心技术与解决方案奖”

百度大脑

人工智能 智能客服

mPaaS 月度小报|魔方卡片(Cube)公测,十个卡片模板任意使用

蚂蚁集团移动开发平台 mPaaS

小程序 消息推送 移动开发 API网关 cube

JVM中的对象及引用

Ayue、

技术专题合集

莫要寻找可能不存在的答案

FunTester

学习 解决方案 自学 FunTester 思路

等保工作五大误区汇总,让你更懂等保!

行云管家

网络安全 等保 等级保护

架构实战营 模块七作业

felix

「架构实战营」

Go语言学习查缺补漏ing Day2

恒生LIGHT云社区

Go 编程语言

滚雪球学Python系列,真能学会Python!

梦想橡皮擦

内容合集 签约计划第二季

Redis架构实战:高并发情况下并发扣减库存

编程江湖

java编程

给弟弟的信第1封|兄弟是父母带给我们最好的礼物

大菠萝

28天写作

前端开发怎么学习才能更快的提高学习效率

@零度

大前端

CIO如何制定低代码/无代码战略

BeeWorks

清空数组的几个方式

编程江湖

大前端

开始读 Go 源码了

AlwaysBeta

golang 源码 源码阅读 源码剖析 Go web

MySQL「 Every derived table must have its own alias」1248 错误修复法

蒋川

数据库 MySQL 运维 MySQL 数据库

详解工作流框架Activiti的服务架构和组件

华为云开发者联盟

工作流 工作流引擎 BPM Activiti BPMN

打造基于 PostgreSQL/openGauss 的分布式数据库解决方案

SphereEx

数据库 开源 分布式数据库 ShardingSphere SphereEx

如何在 Flutter 中设置背景图像【Flutter专题15】

坚果

flutter 28天写作 签约计划第二季 12月日更

什么是云计算?云计算特点是什么?

行云管家

云计算 公有云 混合云 云资源

模仿UP主,用Python实现一个弹幕控制的直播间!

Zhendong

Python

青藤解密:72%客户容器规模>100个,[镜像安全]谁来保护?

青藤云安全

镜像安全

做一款互联网内容平台,到底要懂多少AI?

百度开发者中心

AI

同态加密实现数据隐私计算,能让你的小秘密更加秘密

华为云开发者联盟

数据 加密 同态加密 联邦计算 数据隐私计算

面对行业难题,华为云邀请物联网全行业拿出“亮剑”精神

华为云开发者联盟

IoT 华为云 LiteOS HarmonyOS IoT边缘

HBase 和 Hive 的差别是什么,各自适用在什么场景中

编程江湖

大数据

模运算和与运算的一点儿简单思考

LSJ

位运算 二进制

复杂场景,从OpenTSDB迁移到TDengine的最佳实践

TDengine

数据库 tdengine

大数据开发技术应该怎么学习入门才好

@零度

大数据

软件工程师年满 40 岁,下一步怎么走?|本周话题

InfoQ写作社区官方

生涯规划 个人成长 职业规划 话题讨论

【Java】代码重构时,为什么禁止在方法内对对象类型的入参赋值

恒生LIGHT云社区

Java 代码规范 java代码规范

没想到国内大模型厂商又一次high起来,是因为OpenAI 断供!_生成式 AI_华卫_InfoQ精选文章