写点什么

Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶

  • 2025-05-09
    北京
  • 本文字数:3469 字

    阅读完需:约 11 分钟

大小:1.58M时长:09:13
Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶

当地时间 5 月 7 日,法国 AI 初创公司 Mistral AI 宣布推出新模型 Mistral Medium 3。总的来说,新模型有三个亮点:

 

  1. 引入一个全新的模型类别,兼顾 SOTA 性能、成本大降 87.5%,并以支持以更简单的部署方式,加速企业落地应用。

  2. 在编程和多模态理解等专业场景中表现突出。

  3. 具备一系列企业级功能,包括:混合部署或本地/虚拟私有云(VPC)部署、定制化的后训练及可集成至企业工具和系统中。

 

据官方介绍,在各项基准测试中,Mistral Medium 3 能达到或超过 Claude Sonnet 3.7 的 90%,但成本却低得多(每百万 token 输入 0.4 美元/输出 2 美元)。定价方面,无论是 API 还是自部署系统,该模型优于 DeepSeek V3 等模型。

 

“在性能方面,该模型超越了领先的开源模型(如 Llama 4 Maverick)以及企业级模型(如 Cohere Command A)。在价格方面,它也优于 DeepSeek V3 等低价模型,无论是在 API 使用还是自部署系统方面都更具优势。”官方表示。

 

据介绍,Mistral Medium 3 在编码和 STEM 任务中尤其突出,在这些任务中,它的表现与参数大但速度慢得多的竞争对手相差无几。 



除了学术基准测试外,Mistral 还发布了更能代表实际用例的第三方人工评测。“Mistral Medium 3 在编码领域继续大放异彩,其全面性能远超一些参数规模更大的竞争对手。”

 



此外,Mistral Medium 3 支持在任意云平台部署,包括配置为四块 GPU 及以上的自托管环境。

 

“可惜 Mistral 已经过时了。写小说效果差,编程还行,但也不算特别出色。Qwen 3 30B、Gemma 3 27B、GLM-4 很难被超越。”有网友评价道。

 

失去了开源口碑

 

2023 年 9 月,开源 Mistral 7B 模型以超越同量级竞品的性能和选择开放性的 Apache 2.0 许可证引发社区轰动,这也让这家刚成立不久的大模型公司迅速进入公众视野。

 

Mistral 并非所有模型都开源,这无可厚非。问题是,自 Mistral 7B 后, Mistral 再没有一个拿得出手的开源模型。而 Mistral 更先进模型的应用,例如其广受好评的一款新编程工具,目前仅在商业平台上销售,且已经与微软、亚马逊和谷歌达成了云分销协议。以至于,网友都在呼吁 Mistral 赶紧出下一个开源模型。

 


“非本地版本,没有开放权重,无法与 Qwen3 进行比较,又一个不相关的版本。” Medium 3 发布后网友 AaronFeng47 给出的评价。

 

对于 Mistral 在官博中写的“即便是我们的中等规模模型,在性能上也远超旗舰级开源模型(如 Llama 4 Maverick),我们对未来‘开放’发布的内容充满期待。”有网友怒道:

 

“开放”是吧?他们的行为真的有些奇怪。最初在 1 月 30 日那篇博客文章中,他们让社区充满期待,仿佛要从他们专有的“开放权重”许可 MRL 转向 Apache-2.0 许可:“我们重申对在通用模型上使用 Apache 2.0 许可的承诺,并将逐步淘汰 MRL 许可的模型。 ”

 

然而在接下来的四个月时间里,他们至少发布了三款更加受限的“开放权重”模型(Saba、Mistral OCR 和 Mistral Medium 3),这些模型仅能供企业客户在本地自托管部署。

 

如果不是因为他们对“承诺”的不断漠视,我也不会因此指责他们。搞笑的是,他们在这段期间里几乎只发布了一款真正开源的模型——Mistral Small 3.1(相较 Mistral Small 3 只是小幅更新),而社区对此反响平平。

 

“现在我希望他们能发布一个开源权重模型,其质量至少能与 GPT-4.1 mini 相媲美,但模型规模最多与当前的 Mistral Small 一样,或者如果是 MoE 模型,则规模可与新推出的 Qwen 3 30B A3B 相当。我们总可以做个美梦,对吧?”有网友讽刺道。

 

在 AI 领域,一年是很长的时间。随着人们发现 Mistral 在 AI 竞赛中难以追赶更大规模的竞争对手,大家最初的热情开始冷却。

成也“高效率”,败也“高效率”?

 

Mistral AI 的三位创始人都有在美国大型科技公司从事 AI 研究的背景,这些公司在巴黎也有重要业务。CEO Arthur Mensch 曾在 Google 的 DeepMind 工作,CTO Timothée Lacroix 和首席科学官 Guillaume Lample 则是前 Meta 员工。这三个人被誉为“将欧洲最终推上科技顶尖舞台的英雄。”



“我们曾协助他们进行早期融资,并在公司架构初期提供支持……但真正去执行这些的,还是他们自己,”巴黎健康保险初创 Alan 创始人兼 CEO Jean-Charles Samuelian-Werve 说道,“对于欧洲在生成式 AI 领域实现战略自主的想法固然重要,但 Mistral 更希望成为一个全球性的佼佼者。”

 

Mistral 一直将成本效率视为最大的优势。“我们使用的算力比美国竞争对手少了 100 倍,但我们已经能够开发出几乎处于前沿水平的模型,”Mensch 在接受《金融时报》采访时表示。

 

这一策略为 Mistral 赢得了包括微软在内的支持者。微软与该初创公司签署了合作协议并入股少量股份,这是微软在 OpenAI 之外对大模型公司的首笔投资。基准测试网站(如 RankedAI.co)也将 Mistral 列为全球十大模型开发者之一。

 

但 Mistral 正在被包括 DeepSeek 在内的新兴竞争对手超越。经济咨询公司 Entext 创始人 Sean Maher 表示:“中国无疑已经接过了这一接力棒,成为 OpenAI 及其美国竞争对手的‘快速追随者’。”他将 DeepSeek 的最新模型 V3 称为“令人瞠目结舌的时刻”,并认为“它将改变整个行业的经济格局”。

 

尽管一些支持者认为这证明了 Mistral 的做法是正确的,但也有人认为这是对其提供负担得起的“开放”AI 商业模式的威胁。甚至一些欧洲科技创始人和投资者认为,在前沿大模型开发者几乎可以获得无限资本的时期,Mistral 选择聚焦“高效率”是一种战术上的失误。

 

“全欧洲的希望”最好的归宿是“卖身”?

 

法国总统马克龙也对这家初创公司给予了热情支持,他被 Mistral “主权化”且更“开放”的 AI 承诺所吸引,非常认同其完全独立于美国大型科技公司的定位。欧盟在 2023 年底讨论其首部旗舰人工智能法规时,马克龙等人还警告布鲁塞尔政府不要用过多的繁文缛节来阻碍这一新兴行业的发展。

 

尽管欧洲还有一些前景可期的 AI 初创公司,如英国的 Wayve、德国的 DeepL 和 Black Forest Labs,以及法国的 Poolside,但目前没有一家在开发大模型。曾被寄望成为德国本土大模型冠军的 Aleph Alpha,去年已离开大模型领域,这使 Mistral 成为欧洲唯一的重量级选手。

 

随着面临着更大的竞争压力,去年市场上开始传出 Mistral 被收购的消息。

 

在今年的达沃斯论坛上,Mensch 回避了关于 Mistral 是否会像许多较小玩家那样不得不出售给大型科技公司的提问。但他坚称不会出售 Mistral,并希望公司有朝一日可以上市。“我们认为,作为一家独立公司所做的事情非常重要,”他说道,“所以这不在考虑范围内。”

 

不过,一位 Mistral 投资人在私下里并不那么乐观。“我们开始看到不好的征兆,”该人士说道,“他们需要出售自己。”

 

Mistral AI 成立不足两年,却已在去年 6 月完成了 6 亿欧元的融资,估值接近 60 亿欧元,但批评者认为该公司正处于 AI 初创企业的尴尬困境:筹资规模过大,无法悄然退出市场;但又不足以在全球 AI 竞赛中保持领先地位。

 

目前,Mistral AI 的员工人数约为 150 人,而其美国竞争对手拥有数千名员工。

 

当被问及 Mistral 是否计划在今年筹集更多资金时,Mensch 表示:“可能吧,尽管我们不一定需要。市场上确实已经有人对此感兴趣。”

 

Maher 预测,Mistral 的发展可能会效仿 Adept 和 Inflection 等 AI 初创企业,最终被大型科技公司“人才收购”。不过,这种情况是否会发生,还取决于布鲁塞尔的反垄断监管机构是否允许这样一个具有战略意义的欧洲资产被美国买家收购。“形势已经发生变化,(Mistral)需要找准自己的定位,否则就会被淘汰。” 

 


领先的 AI 企业已筹集了超过 500 亿美元的资金——远远超过 Mistral 

 

如今,Mistral AI 通过 Le Chat 的付费层来获取部分收入。Le Chat Pro 计划在今年 2 月推出,定价为 14.99 美元/每月。在 B2B 领域,Mistral AI 通过基于使用量定价的 API 来变现其旗舰模型。企业也可以为这些模型购买许可证,公司可能还从其战略合作伙伴关系中获得了可观的收入份额。

 

熟悉 Mistral 财务状况的投资者称,其年化运行率 (ARR)已达数千万美元。与此同时,据报道,Anthropic 去年销售额接近 10 亿美元,而 OpenAI 的营收则接近 40 亿美元。

 

硅谷风投公司 Menlo Ventures 的一项研究显示,Mistral 在企业级 AI 市场中排名第五,去年市占率仅为 5%,不到 Google 或 Meta 的一半,远远落后于 OpenAI。

 

参考链接:

https://mistral.ai/news/mistral-medium-3

https://techcrunch.com/2025/05/05/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/?utm_source=chatgpt.com

https://www.ft.com/content/fa8bad75-dc55-47d9-9eb4-79ac94e54d82?utm_source=chatgpt.com

2025-05-09 13:579017

评论

发布
暂无评论

GrowingIO Design 组件库搭建之开发工具

GrowingIO技术专栏

设计 大前端

架构师训练营第二周作业 - 命题作业

阿德儿

废弃fastjson!大型项目迁移Gson保姆级攻略

Zhendong

Java json Gson Fastjson

阿里P8内部架构核心学习知识笔记在各大互联网上流传,限时开放下载

Java架构之路

Java 程序员 架构 面试 编程语言

Java 程序经验小结:用私有构造器或者枚举类型强化Singleton属性

后台技术汇

28天写作

Redis 用的很溜,了解过它用的什么协议吗?

古时的风筝

redis RESP Redis 协议

一周信创舆情观察(1.4~1.10)

统小信uos

币值管理机器人系统开发|量化交易系统开发

W13902449729

币值管理机器人系统开发 量化交易系统开发

备战2O2I新年资料

ios 面试

数字货币量化对冲搬砖套利交易软件APP系统开发

系统开发

TRX智能合约系统开发案例详解

electron实战练习-三个文件实现一个命令行终端

OBKoro1

node.js Electron electron实战 命令行终端 electron学习

最近线上发生的两个坑爹锅

艾小仙

后端

我以为自己够牛逼了,直到看到了Alibaba专家的面试笔记,我学习了三个月,却入职京东,税前36K

Java架构之路

Java 程序员 架构 面试 编程语言

盘点2020 | 人生是一场马拉松-OBKoro1的2020年年终总结

OBKoro1

2020 大前端 年终总结 OBKoro1

WebRTC ICE 状态与提名处理

阿里云CloudImagine

阿里云 WebRTC 通信 流媒体开发 流媒体传输

普通人必须掌握的五个必学理财知识

v16629866266

架构师训练营第二周作业 - 学习总结

阿德儿

又出神作!阿里技术官再出山,操作性超强的Spring事务+AOP实践手册

比伯

Java 编程 程序员 架构 面试

阿里中间件团队技术官手撸笔记,全新演绎“Kafka部署实战”,已开源

Java架构之路

Java 程序员 架构 面试 编程语言

mysql字符串字段索引优化

瞌睡的李先生

MySQL 索引

细节决定成败!致Android高级工程师的一封信,实战解析

欢喜学安卓

android 程序员 面试 移动开发

安卓开发在线!字节跳动Android研发岗这些知识点内部泄露出来了,已拿到offer

欢喜学安卓

android 程序员 面试 移动开发

新思科技静态应用安全测试解决方案获得Forrester Wave认可

InfoQ_434670063458

新思科技 Forrester Wave 静态应用安全测试

低代码开发平台的技术路线

Sam678678

量化交易系统开发软件源码

快速入门案例实战:电商网站商品管理(一)

escray

elasticsearch elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

keycloak集群化的思考

程序那些事

架构设计 架构师 权限系统 程序那些事 集群服务

图解 | 原来这就是网络

编程 网络 计算机

springboot整合Shiro

Java架构师迁哥

龙归科技 |企业办公自动化的未来

龙归科技

Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶_AI&大模型_褚杏娟_InfoQ精选文章