写点什么

Mistral 发布 Medium 3:企业级中型语言模型

作者:Robert Krzaczyński

  • 2025-05-25
    北京
  • 本文字数:882 字

    阅读完需:约 3 分钟

大小:428.25K时长:02:26
Mistral发布Medium 3:企业级中型语言模型

Mistral AI 推出 Mistral Medium 3,一款面向企业的中型语言模型,其目标是在成本效率、卓越性能和灵活部署之间实现完美平衡。该模型目前已通过 Mistral 平台和 Amazon SageMaker 提供服务,后续计划在 IBM WatsonX、Azure AI Foundry、Google Cloud Vertex AI 和 NVIDIA NIM 上发布。


据 Mistral 称,Mistral Medium 3 的性能与 Claude Sonnet 3.7 等大模型相当,在内部基准测试中,其得分超过了后者 90% 的水平,同时在成本控制方面表现出色,预计输入每百万 token 的成本为 0.4 美元,输出费用为 2 美元。Mistral 的报告指出,该模型超越了 LLaMA 4 Maverick 等开源模型,并在编码和 STEM 相关任务中相较于其他商业产品展现出了显著优势。


来源:Mistral AI 博客


Mistral Medium 3 支持在多种环境中进行灵活的部署,包括混合部署和完全本地部署,最少只需要四块 GPU 即可运行。它还提供定制选项,包括后训练、微调以及与私有企业数据和工具集成。


在实际应用场景中,Mistral Medium 3 在编码、客户支持自动化和技术数据分析方面表现出了显著的潜力。Mistral AI 公司表示,金融、能源和医疗保健行业已率先采用该模型,并强调了其在特定领域应用中的高度兼容性和适应性。


然而,并非所有来自社区的反馈都是积极正面的。一位 Reddit 用户 评论 道:


它的性能不如 DeepSeek,但 API 的价格却更高。而且由于他们没有发布权重,因此不清楚为什么有人会为此付费。


这种观点反映了专有模型与开放权重替代品之间的争论,尤其是在那些高度重视透明度和微调控制能力的开发者和研究社区中。


另一方面,该模型得到了企业专业人士的支持。Okta 新兴市场销售总监 Arnaud Bories 表示


祝贺 Mistral AI 团队成功推出这一激动人心的产品。他们对企业和企业级定制与安全的关注确实令人印象深刻。在 Okta,我们始终在探索身份如何利用身份识别作为安全、无缝采用 AI 的催化剂——期待看到我们共同支持和增强这些创新。


随着企业 AI 市场的不断拓展,Mistral Medium 3 进入了一个竞争激烈的领域,带来了一款优先考虑部署灵活性、成本控制和集成准备的模型。


原文链接

https://www.infoq.com/news/2025/05/mistral-ai-medium/

2025-05-25 12:003846

评论

发布
暂无评论

BaikalDB 架构演进实录:打造融合向量化与 MPP 的 HTAP 查询引擎

百度Geek说

MPP 分布式数据 MPP 架构 向量化引擎

数字藏品(NFT)系统的上线运营

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

内网IM选型逻辑:企业为何青睐自研或外采私有化IM

BeeWorks

即时通讯 IM

Framework失败问题,全面整理.NET Framework 各种安装失败及异常情况

小焱

Framework

组件库实战-基建思路

溪抱鱼

typescript Vue Rest

图解JavaScript原型:原型链及其分析 | JavaScript图解

电子尖叫食人鱼

JavaScript

深入研究:shopee商品列表API接口指南

tbapi

shopee商品列表接口 shopee数据采集 shopee接口

摩尔线程重磅亮相2025北京智源大会,传递国产算力发展加速度

新消费日报

准确率从 19% 提升至 95%!文本审核模型优化的三个阶段实践(下)

亚马逊云科技 (Amazon Web Services)

吴恩达:AI 被过度炒作,但语音 AI 产品却被低估;ChatGPT 升级语音翻译功能丨日报

RTE开发者社区

华为云重磅亮相 KubeCon China 2025 ! 精彩议程一览

华为云开源

开源 云原生 华为云

AI实时对话开启粉丝互动新时代

腾讯云音视频

人工智能 腾讯云 实时音视频 trtc AI实时对话

HTAP 技术:融合事务与分析的数据处理新范式

镜舟科技

OLAP OLTP HTAP 数据库架构 实时分析

通义灵码 AI IDE 上线!智能体+MCP 从手动调用工具过渡到“AI 主动调度资源”

阿里巴巴云原生

通义灵码

鸿蒙Next仓颉语言开发实战教程:店铺详情页

幽蓝计划

DirectX 修复工具增强版:Direct 官方中文修复利器免费下载

小焱

dll DLL库 directx directx不兼容 dll缺失

2026深圳电子展,中国(深圳)国际电子信息展览会

AIOTE智博会

电子展 深圳电子展 电子信息展 电博会

分析师:对英特尔未来发展持谨慎乐观态度

E科讯

员工反感的不是周报,而是消耗人的形式化

禅道项目管理

项目管理 数字化转型 周报 禅道项目管理软件

AWS EKS 集群日志上报观测云实践

观测云

aws lambda

实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨Voice Agent 学习笔记

RTE开发者社区

中烟创新智能稽核平台:为烟草行业定制的数字化风控引擎

中烟创新

就医体验飙升的背后,是CPU在“悄悄打工”?

E科讯

短信验证码服务最佳实践:个人开发者如何选择和集成现代化短信服务

外滩运维专家

懒懒笔记 | 课代表带你梳理【RAG课程 11&12:优化和加速你的RAG】

商汤万象开发者

AI LLM rag实战

报名启动|隐语开源社区Meetup大湾区站 x 数据安全沙龙来啦

隐语SecretFlow

数据安全 隐私计算 数据流通 数据要素流通

DJ舞台设计:重塑电子音乐体验

Dylan

Dj LED显示屏 全彩LED显示屏 led显示屏厂家 舞台表演

小程序容器驱动SuperApp生态:下一代前端技术范式

xuyinyin

焱融存储成为 AMD 中国行业生态共建计划首批合作伙伴

焱融科技

人工智能 AMD AMD EPYC 处理器 焱融全闪存储

4种比常见的线程池和线程同步买票问题

量贩潮汐·WholesaleTide

Java Python

Mistral发布Medium 3:企业级中型语言模型_AI&大模型_InfoQ精选文章