2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业

  • 2025-03-18
    北京
  • 本文字数:2152 字

    阅读完需:约 7 分钟

大小:1.10M时长:06:22
Cohere发布多语言Command A模型:仅需两张GPU即可服务全球企业

整理 | 华卫、核子可乐

 

日前,加拿大 AI 初创公司 Cohere 发布了其最新生成式 AI 模型 Command A,据称专为企业应用场景设计而成。据了解,Cohere 由 2017 年开启大语言模型革命的 transformer 论文作者之一 Aidan Gomez 与他的两位多伦多大学校友 Ivan Zhang 和 Nick Frosst 联合创立。除此之外,该公司旗下非营利子公司 Cohere for AI 还于本月初发布了名为 Aya Vision 的开源多语言视觉模型(仅供研究)。

 

据介绍,作为 2024 年 3 月首次亮相的 Command-R 及后续 Command R+大模型的继任者,Command A 以 Cohere 在检索增强生成(RAG)、外部工具以及企业 AI 效率领域的研发成果为基础,主要强调以更快速度完成计算并交付答案。

 

比 Command-R 更进一步

 

当初 Command-R 于 2024 年首次亮相时,就曾引入一系列关键创新,如优级 RAG 性能、更好的知识检索效果与更低的 AI 部署成本。该模型很快获得企业青睐,并被整合至甲骨文、Nation、Scale AI、埃森哲及麦肯锡等公司的商业解决方案当中。不过 Menlo Ventures 在 2024 年 11 月发布的企业采用调查报告中指出,Cohere 在企业领域的市场份额仅为 3%,远低于 OpenAI 的 34%、Anthropic 的 24%乃至 Mistral 等小型初创厂商的 5%。

 

如今,为了吸引更多企业的加入,Command A 进一步拓展了这些功能。根据官方介绍,新版本:

  • 在商业、STEM 及编码任务中等同或超越了 OpenAI 的 GPT-4o 与 DeepSeek-V3。

  • 可仅依托两张 GPU(A100 或 H100)运行,相较于其他需要多达 32 张 GPU 模型在效率上实现了显著提升。

  • 可实现更快的 token 生成速度,每秒可生成 156 个 token——相当于 GPT-4o 的 1.75 倍,DeepSeek-V3 的 2.4 倍。

  • 降低延迟,首 token 生成时间为 6500 毫秒,优于 GPT-4o 的 7460 毫秒与 DeepSeek-V3 的 14740 毫秒。

  • 增强多语言 AI 能力,改进了对阿拉伯语方言的支持并扩展支持 23 种全球语言。

 

Cohere 通过 Command A 延续了其企业优先战略,确保此模型能够无缝集成至业务环境当中。Command A 的核心特性包括:

  • 高级检索增强生成(RAG):为企业应用程序提供可验证的高精度响应结果。

  • 使用代理式工具:与企业工具相集成以支持复杂的工作流程。

  • North AI 平台集成:与 Cohere 的 North AI 平台配合使用,允许企业使用安全的企业级 AI 智能体自动执行任务。

  • 可扩展性与成本效率:私有部署的成本比 API 访问低 50%。

  • 支持多种语言,在阿语支持方面表现出色。Command A 的一大突出特点,是它能够对全球 23 种最常用语言生成准确响应,包括经过改进的阿拉伯方言处理能力。

 

此外,速度是企业 AI 部署中的关键因素,Command A 的设计目标正是以超越竞争对手的速度交付生成结果。100K 上下文请求的 token 流速度为:每秒 73 个 token(相比之下,GPT-4o 为每秒 38 个 token,DeepSeek-V3 则为每秒 32 个 token)。首次 token 生成速度更快:与其他大模型相比,Command A 的响应速度明显更快。

 

基准测试结果中,Command A 在使用阿拉伯语响应英语提示词的准确率为 98.2%——高于 DeepSeek-V3 的 94.9%与 GPT-4o 的 92.2%。它在方言一致性方面的表现似乎也明显优于竞争对手,ADI2 得分为 24.7,远高于 GPT-4o 的 15.9 与 DeepSeek-V3 的 15.7。

 

凭借更快的速度、更低的硬件要求加上扩展后的多语言功能,Command A 将自身定位成 GPT-4o 及 DeepSeek-V3 等模型的有力替代选项——请注意,这里列出的均是经典的大语言模型,而非最近掀起行业热潮的新兴推理模型。与能够支持 12.8 万个 token 上下文长度(即大模型在一次输入/输出交换中可以处理的信息量,12.8 万 token 相当于一本 300 页的小说)的前身不同,Command A 将上下文长度增加了一倍,达到 25.6 万个 token(相当于 600 页文本),同时提高了整体效率与生产应用就绪水平。

 

行业反响

 

现在,Command A 已在 Cohere 平台上正式上线,并在 Hugging Face 上基于 Creative Commons Attribution Non Commercial 4.0 International (CC-by-NC 4.0)许可证提供开放权重,但仅供研究使用。后续还将面向广泛云服务商提供支持方案。输入 token:每百万个 2.5 美元;输出 token:每百万个 10.00 美元。可根据要求提供私有与本地部署。

 

多位 AI 研究人员及 Cohere 团队成员表达了自己对于 Command A 的赞赏之情。Cohere 公司预训练专家 Dwaraknath Ganesan 在 X 上发帖表示:“很高兴能够展示我们过去几个月间倾力研究的成果!Command A 非常出色,只需两张 H100 GPU 即可部署!256K 上下文长度、经过扩展的多语言支持、代理式工具使用……我们对此深感自豪。”

 

Cohere 公司 AI 研究员 Pierre Richemond 补充道,“Command A 是我们全新打造的 GPT-4o/DeepSeek V3 级别、开放权重 111B 模型,可支持 256K 上下文长度,且针对企业用例的运行效率进行了优化。”凭借更快的运行速度、更大的上下文窗口、更好的多语言处理能力以及更低的部署成本,它将针对企业需求为现有 AI 模型提供强大的替代选项。

 

Cohere 在其开发者文档中指出,“Command A 非常健谈。在默认情况下,该模型为交互式设计,并针对对话进行了优化。就是说它的输出内容很长,而且会使用 markdown 来高亮显示代码。要覆盖此机制,开发人员可在前置词中要求模型仅提供答案,且不使用 markdown 或代码块标记。”

 

由此看来,Command A 有望成为那些预算有限、但又亟需建立 AI 优势的企业,以及快速响应类应用场景(例如金融、医疗、医学、科学和法律)下的理想模型选项。

 

参考链接:

https://venturebeat.com/ai/cohere-targets-global-enterprises-with-new-highly-multilingual-command-a-model-requiring-only-2-gpus/

 

2025-03-18 11:213909

评论

发布
暂无评论

火山引擎DataLeap:在数据研发中,如何提升效率?

字节跳动数据平台

运维 数据研发 企业号 4 月 PK 榜 任务模板

AITO问界M5:最安全、智能的座驾

极客天地

构建云边端一体的分布式云架构,软硬结合驱动边缘计算创新场景

百度开发者中心

云计算 存储 边缘云

selenium源码通读·10 |webdriver/common/proxy.py-Proxy类分析

Python 测试 自动化测试 源码剖析 selenium

中国垂直行业SaaS,这样走可能是新出路

ToB行业头条

走进社区客户端测试 | 得物技术

得物技术

测试

北大GPT解题有数学老师内味了,用人话讲难题,从高中数学到高数都能搞定

Openlab_cosmoplat

人工智能 开源社区

怎样判断户外LED显示屏质量是否达标

Dylan

媒体 广告 户外LED显示屏

提交代码「前置处理」,向前一小步,效率提升「亿点点」

极狐GitLab

DevOps 极狐GitLab git hook lefthook 代码前置

“精准测试” 在商家地址专项的探索 | 得物技术

得物技术

面试还不懂JVM性能调优,看这篇文章就够了!

程序员小毕

程序员 面试 后端 JVM jvm调优

如何开发一个小程序自定义组件

Onegun

小程序 前端 小程序组件

基于STM32设计避障寻迹小车

DS小龙哥

三周年连更

行业分析| 视频监控——AI自动巡检

anyRTC开发者

人工智能 音视频 视频监控 自动巡检

0Ω电阻在PCB板中的5大常见作用

华秋PCB

电路 元器件 PCB PCB设计 电阻

如何写出CPU友好的代码,百倍提升性能?

阿里技术

cpu 代码优化

智能感知编码优化与落地实践

百度开发者中心

人工智能 视频 百度智能云

烟雾弹?突然转变?如何看待微软发声:中国是主要的对手

加入高科技仿生人

人工智能 AI 数智化 ChatGPT

您有一份直播回放待查收!

BinTools图尔兹

直播回放 版本发布

软件测试/测试开发丨自动化测试之读取配置文件

测试人

软件测试 自动化测试 测试开发

2023年第十二届数据技术嘉年华(DTC)资料分享

墨天轮

数据库 oracle 云原生 智能运维 国产数据库

乌合之众再次上演,打工人将被AI一键淘汰?

引迈信息

人工智能 AI 低代码 AIGC ChatGPT

智慧园区数字转型下的移动App建设策略

Onegun

移动应用 智慧城市 智慧园区

HummerRisk V1.0.1:k8s检测扩充、批量删除及修复bug

HummerCloud

开源 云原生 云安全 云原生安全

知名直播App被苹果商店下架,或涉及侵权问题

曲多多(嗨翻屋)版权音乐

ios iphone 软件开发

给广场舞大妈讲讲什么是大语言模型!

FN0

AIGC

vue 入门知识点有哪些?

海拥(haiyong.site)

三周年连更

iOS MachineLearning 系列(4)—— 静态图像分析之物体识别与分类

珲少

世界读书日特辑 | 华为阅读深耕精品书,让读书变得赏心“悦目”

最新动态

Android C++系列:函数返回值注意事项

轻口味

c++ android 三周年连更

Cohere发布多语言Command A模型:仅需两张GPU即可服务全球企业_AI&大模型_华卫_InfoQ精选文章