2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

作者:Daniel Dominguez

  • 2025-05-28
    北京
  • 本文字数:1046 字

    阅读完需:约 3 分钟

大小:535.19K时长:03:02
Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

Mistral AI 宣布推出 Devstral,一款与 All Hands AI 合作开发的新型开源大语言模型。该模型是为提升软件工程工作流的自动化水平,特别适用于需要跨多文件和多组件进行推理的复杂编码环境。与仅提供优化的代码补全函数生成等独立任务的模型不同,Devstral 通过代码智能体框架在整个代码库层面运作,专为解决实际编程问题而设计。

 

作为新一代智能体语言模型,Devstral 不仅能生成代码,更能根据具体任务执行上下文相关操作。这种智能体架构使模型能够:跨文件进行迭代修改、探索代码库、在最小人工干预下提出错误修复或新功能建议。这些能力契合现代软件工程需求:理解项目结构和依赖关系与编写语法正确的代码同等重要。

 

据 Mistral 内部评估,Devstral 在 SWE-Bench Verified 基准测试中获得 46.8% 的得分(该测试包含 500 个经人工筛选的 GitHub 问题)。这一成绩超越此前所有开源模型,领先优势超 6 个百分点。该基准不仅评估代码生成有效性,更能检验代码可否实际解决真实项目中的文档化问题。在相同 OpenHands 框架下,Devstral 的表现显著优于参数量更大的 Deepseek-V3-0324(6710 亿参数)和 Qwen3 232B-A22B,凸显了其效率优势。

 

Devstral 是基于 Mistral Small 3.1 模型微调而成。训练前移除了视觉编码器,形成完全基于文本的代码理解和生成模型。支持 12.8 万 token 的上下文窗口,可单次处理大型代码库或长对话。240 亿的参数规模使其兼具轻量级特性,开发者使用英伟达 RTX 4090 等消费级 GPU 或 32GB 内存的 Apple Silicon 设备即可本地运行,降低了敏感代码环境的使用门槛。

 

Mistral 采用宽松的 Apache 2.0 许可发布 Devstral,允许商业或非商业用途及修改再分发。模型可通过 Hugging FaceLM StudioOllamaKaggle 等平台获取,也可通过 Mistral 自己的 API(标识符 devstral-small-2505)调用。

 

社区中兴奋与审慎的反响并存。产品构建师 Nayak Satya 评论道:


Mistral 又一次带来了令人期待的升级。这家公司正为 AI 领域默默构建重要补充。当 Mistral 崛起时,欧洲在 AI 领域并不落后。顺便一问,能否将其集成到 VS Studio 等现代 IDE 中?

 

Reddit 的 r/LocalLLaMA 版块用户 Coding9 表示:


在 Cline 中的简单任务测试成功,难以置信!之前其他本地模型从来都没运行成功过,很快将尝试更复杂的任务。

 

尽管是以研究预览版发布,Devstral 标志着大语言模型在实际软件工程应用中的进步。Mistral 透露更大规模的版本已在开发中,后续版本将具备更先进能力。公司正邀请开发者社区提供反馈,以优化模型及其与软件工具生态的集成。

2025-05-28 14:003898

评论

发布
暂无评论

创业失败启示录|校园微生活(故事篇3)

阿萌

28天写作 创业失败启示录 青城

pub哥的2020文章清单

JavaPub

Java javapub

油车和电车比到底哪个整体能源利用效率高?(28天写作 Day6/28)

mtfelix

自动驾驶 28天写作 电动汽车

GaussDB(DWS)性能调优系列实现篇六:十八般武艺Plan hint运用

华为云开发者联盟

数据库 性能优化 sql GaussDB 算子

《适用于初学者的Python》

计算机与AI

欢迎来到机器人的打工时代「幻想短篇 6/28」

道伟

28天写作

项目管理系列(2)-如何写好一份报告

Ian哥

项目管理 28天写作

两种常见的减少信息不对称的办法

熊斌

学习 成长 28天写作

区块链双仓合约交易所系统开发

Swift 算法-栈

Byte_Panda

算法

28天瞎写的第二百一七天:你们 CentOS 服务器还有图形界面啊?

树上

28天写作

关于焦虑的思考

.

28天写作

需求条目化:一个让用户故事有效落地的套路

华为云开发者联盟

敏捷 项目 需求条目化

碎碎念之「被误会的佛系,被遗忘的疯魔」

Justin

碎碎念 心灵鸡汤 28天写作 佛教

微信视频号的排版,怎样才好看 | 视频号 28 天 (07)

赵新龙

28天写作

浅析Mysql数据库优化设计规范的“度”

三石

MySQL 28天写作

量化对冲搬砖套利交易APP开发|量化对冲搬砖套利交易系统软件开发

系统开发

[4/28]保障产品高质量交付业务价值

L3C老司机

测试一年多,上线就崩溃!微服务到底应该怎么测试?

阿里巴巴中间件

中间件

大流量场景下如何云淡风轻地进行线上发布?

阿里巴巴中间件

区块链轻节点:“身”轻,责任重

华为云开发者联盟

区块链 数据 数据隐私 轻节点

读书笔记:《中产阶级如何保护自己的财富》

lidaobing

28天写作 中产阶级如何保护财富

读《快手要上市了》,一起了解快手

李忠良

开源 技术 28天写作

关于“面试造火箭,入职拧螺丝” Jan 14, 2021

王泰

28天写作

一个奇怪的 Elasticsearch 节点

escray

elasticsearch elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

【HTML】已经废弃的align(图像对齐方式)

德育处主任

html html5 Web html/css 28天写作

数据结构与算法-时间和空间复杂度

Byte_Panda

算法

简单三招,每个管理者都可以成为有温度的共情高手

一笑

沟通与管理 28天写作

为什么我们需要自动化回归?

阿里巴巴中间件

中间件

生产环境全链路压测建设历程 28:FAQ 之 混沌工程

数列科技杨德华

28天写作

HDFS SHELL详解(7)

罗小龙

hadoop 28天写作 hdfs shell

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型_AI&大模型_InfoQ精选文章