免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

作者:Daniel Dominguez

  • 2025-05-28
    北京
  • 本文字数:1046 字

    阅读完需:约 3 分钟

大小:535.19K时长:03:02
Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

Mistral AI 宣布推出 Devstral,一款与 All Hands AI 合作开发的新型开源大语言模型。该模型是为提升软件工程工作流的自动化水平,特别适用于需要跨多文件和多组件进行推理的复杂编码环境。与仅提供优化的代码补全函数生成等独立任务的模型不同,Devstral 通过代码智能体框架在整个代码库层面运作,专为解决实际编程问题而设计。

 

作为新一代智能体语言模型,Devstral 不仅能生成代码,更能根据具体任务执行上下文相关操作。这种智能体架构使模型能够:跨文件进行迭代修改、探索代码库、在最小人工干预下提出错误修复或新功能建议。这些能力契合现代软件工程需求:理解项目结构和依赖关系与编写语法正确的代码同等重要。

 

据 Mistral 内部评估,Devstral 在 SWE-Bench Verified 基准测试中获得 46.8% 的得分(该测试包含 500 个经人工筛选的 GitHub 问题)。这一成绩超越此前所有开源模型,领先优势超 6 个百分点。该基准不仅评估代码生成有效性,更能检验代码可否实际解决真实项目中的文档化问题。在相同 OpenHands 框架下,Devstral 的表现显著优于参数量更大的 Deepseek-V3-0324(6710 亿参数)和 Qwen3 232B-A22B,凸显了其效率优势。

 

Devstral 是基于 Mistral Small 3.1 模型微调而成。训练前移除了视觉编码器,形成完全基于文本的代码理解和生成模型。支持 12.8 万 token 的上下文窗口,可单次处理大型代码库或长对话。240 亿的参数规模使其兼具轻量级特性,开发者使用英伟达 RTX 4090 等消费级 GPU 或 32GB 内存的 Apple Silicon 设备即可本地运行,降低了敏感代码环境的使用门槛。

 

Mistral 采用宽松的 Apache 2.0 许可发布 Devstral,允许商业或非商业用途及修改再分发。模型可通过 Hugging FaceLM StudioOllamaKaggle 等平台获取,也可通过 Mistral 自己的 API(标识符 devstral-small-2505)调用。

 

社区中兴奋与审慎的反响并存。产品构建师 Nayak Satya 评论道:


Mistral 又一次带来了令人期待的升级。这家公司正为 AI 领域默默构建重要补充。当 Mistral 崛起时,欧洲在 AI 领域并不落后。顺便一问,能否将其集成到 VS Studio 等现代 IDE 中?

 

Reddit 的 r/LocalLLaMA 版块用户 Coding9 表示:


在 Cline 中的简单任务测试成功,难以置信!之前其他本地模型从来都没运行成功过,很快将尝试更复杂的任务。

 

尽管是以研究预览版发布,Devstral 标志着大语言模型在实际软件工程应用中的进步。Mistral 透露更大规模的版本已在开发中,后续版本将具备更先进能力。公司正邀请开发者社区提供反馈,以优化模型及其与软件工具生态的集成。

2025-05-28 14:001

评论

发布
暂无评论
Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型_AI&大模型_InfoQ精选文章