
Mistral AI 推出 Mistral Medium 3,一款面向企业的中型语言模型,其目标是在成本效率、卓越性能和灵活部署之间实现完美平衡。该模型目前已通过 Mistral 平台和 Amazon SageMaker 提供服务,后续计划在 IBM WatsonX、Azure AI Foundry、Google Cloud Vertex AI 和 NVIDIA NIM 上发布。
据 Mistral 称,Mistral Medium 3 的性能与 Claude Sonnet 3.7 等大模型相当,在内部基准测试中,其得分超过了后者 90% 的水平,同时在成本控制方面表现出色,预计输入每百万 token 的成本为 0.4 美元,输出费用为 2 美元。Mistral 的报告指出,该模型超越了 LLaMA 4 Maverick 等开源模型,并在编码和 STEM 相关任务中相较于其他商业产品展现出了显著优势。

来源:Mistral AI 博客
Mistral Medium 3 支持在多种环境中进行灵活的部署,包括混合部署和完全本地部署,最少只需要四块 GPU 即可运行。它还提供定制选项,包括后训练、微调以及与私有企业数据和工具集成。
在实际应用场景中,Mistral Medium 3 在编码、客户支持自动化和技术数据分析方面表现出了显著的潜力。Mistral AI 公司表示,金融、能源和医疗保健行业已率先采用该模型,并强调了其在特定领域应用中的高度兼容性和适应性。
然而,并非所有来自社区的反馈都是积极正面的。一位 Reddit 用户 评论 道:
它的性能不如 DeepSeek,但 API 的价格却更高。而且由于他们没有发布权重,因此不清楚为什么有人会为此付费。
这种观点反映了专有模型与开放权重替代品之间的争论,尤其是在那些高度重视透明度和微调控制能力的开发者和研究社区中。
另一方面,该模型得到了企业专业人士的支持。Okta 新兴市场销售总监 Arnaud Bories 表示:
祝贺 Mistral AI 团队成功推出这一激动人心的产品。他们对企业和企业级定制与安全的关注确实令人印象深刻。在 Okta,我们始终在探索身份如何利用身份识别作为安全、无缝采用 AI 的催化剂——期待看到我们共同支持和增强这些创新。
随着企业 AI 市场的不断拓展,Mistral Medium 3 进入了一个竞争激烈的领域,带来了一款优先考虑部署灵活性、成本控制和集成准备的模型。
原文链接:
评论