写点什么

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

作者:Daniel Dominguez

  • 2025-05-28
    北京
  • 本文字数:1046 字

    阅读完需:约 3 分钟

大小:535.19K时长:03:02
Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

Mistral AI 宣布推出 Devstral,一款与 All Hands AI 合作开发的新型开源大语言模型。该模型是为提升软件工程工作流的自动化水平,特别适用于需要跨多文件和多组件进行推理的复杂编码环境。与仅提供优化的代码补全函数生成等独立任务的模型不同,Devstral 通过代码智能体框架在整个代码库层面运作,专为解决实际编程问题而设计。

 

作为新一代智能体语言模型,Devstral 不仅能生成代码,更能根据具体任务执行上下文相关操作。这种智能体架构使模型能够:跨文件进行迭代修改、探索代码库、在最小人工干预下提出错误修复或新功能建议。这些能力契合现代软件工程需求:理解项目结构和依赖关系与编写语法正确的代码同等重要。

 

据 Mistral 内部评估,Devstral 在 SWE-Bench Verified 基准测试中获得 46.8% 的得分(该测试包含 500 个经人工筛选的 GitHub 问题)。这一成绩超越此前所有开源模型,领先优势超 6 个百分点。该基准不仅评估代码生成有效性,更能检验代码可否实际解决真实项目中的文档化问题。在相同 OpenHands 框架下,Devstral 的表现显著优于参数量更大的 Deepseek-V3-0324(6710 亿参数)和 Qwen3 232B-A22B,凸显了其效率优势。

 

Devstral 是基于 Mistral Small 3.1 模型微调而成。训练前移除了视觉编码器,形成完全基于文本的代码理解和生成模型。支持 12.8 万 token 的上下文窗口,可单次处理大型代码库或长对话。240 亿的参数规模使其兼具轻量级特性,开发者使用英伟达 RTX 4090 等消费级 GPU 或 32GB 内存的 Apple Silicon 设备即可本地运行,降低了敏感代码环境的使用门槛。

 

Mistral 采用宽松的 Apache 2.0 许可发布 Devstral,允许商业或非商业用途及修改再分发。模型可通过 Hugging FaceLM StudioOllamaKaggle 等平台获取,也可通过 Mistral 自己的 API(标识符 devstral-small-2505)调用。

 

社区中兴奋与审慎的反响并存。产品构建师 Nayak Satya 评论道:


Mistral 又一次带来了令人期待的升级。这家公司正为 AI 领域默默构建重要补充。当 Mistral 崛起时,欧洲在 AI 领域并不落后。顺便一问,能否将其集成到 VS Studio 等现代 IDE 中?

 

Reddit 的 r/LocalLLaMA 版块用户 Coding9 表示:


在 Cline 中的简单任务测试成功,难以置信!之前其他本地模型从来都没运行成功过,很快将尝试更复杂的任务。

 

尽管是以研究预览版发布,Devstral 标志着大语言模型在实际软件工程应用中的进步。Mistral 透露更大规模的版本已在开发中,后续版本将具备更先进能力。公司正邀请开发者社区提供反馈,以优化模型及其与软件工具生态的集成。

2025-05-28 14:003313

评论

发布
暂无评论

从“群聊”到“一单到底”,天润融通工单系统助力品牌服务升级

天润融通

精通Java并发锁机制:24种锁技巧+业务锁匹配方案(第一部分)

肖哥弹架构

Java 高并发

文心快码Baidu Comate荣获2024北京信息通信行业网络安全产品优秀应用案例

百度安全

实现-最佳实践-蒜蓉扇贝V3

南山

个人成长

实现-最佳实践-要事第一V3

南山

个人成长

实现-最佳实践-资料查找V3

南山

个人成长

百度副总裁陈洋:大模型让软件开发更高效、更安全

百度安全

实现-最佳实践-学做一道菜V3

南山

个人成长

腾讯云AI代码助手:智能AI代码助手 ,新一代的高效代码开发辅助工具

鸽芷咕

腾讯云 科技 代码自动生成

AM Green收购Chempolis下一代2G生物燃料技术;投资10亿美元生产SAF

财见

实现-最佳实践-睡前复盘V3

南山

Groovy 是一门 DSL 语言

FunTester

深入剖析酷睿i7-14700KF与锐龙7 7800X3D:谁才是优秀多面手处理器

E科讯

2024网安周 | 百度安全深度参与,探索人工智能与数字安全的融合发展之路

百度安全

实现-最佳实践-权益维护抉择V3

南山

个人成长

实现-最佳实践-人生规划V3

南山

个人成长

实现-最佳实践-适应高度刺激V3

南山

个人成长

实现-最佳实践-善于分享V3

南山

个人成长

一步迈入数智化,华为坤灵助力中小企业轻松飞跃

脑极体

AI 数智化 分销

一个示例了解什么是 API 集成

幂简集成

API API集成

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型_AI&大模型_InfoQ精选文章