写点什么

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

作者:Daniel Dominguez

  • 2025-05-28
    北京
  • 本文字数:1046 字

    阅读完需:约 3 分钟

大小:535.19K时长:03:02
Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

Mistral AI 宣布推出 Devstral,一款与 All Hands AI 合作开发的新型开源大语言模型。该模型是为提升软件工程工作流的自动化水平,特别适用于需要跨多文件和多组件进行推理的复杂编码环境。与仅提供优化的代码补全函数生成等独立任务的模型不同,Devstral 通过代码智能体框架在整个代码库层面运作,专为解决实际编程问题而设计。

 

作为新一代智能体语言模型,Devstral 不仅能生成代码,更能根据具体任务执行上下文相关操作。这种智能体架构使模型能够:跨文件进行迭代修改、探索代码库、在最小人工干预下提出错误修复或新功能建议。这些能力契合现代软件工程需求:理解项目结构和依赖关系与编写语法正确的代码同等重要。

 

据 Mistral 内部评估,Devstral 在 SWE-Bench Verified 基准测试中获得 46.8% 的得分(该测试包含 500 个经人工筛选的 GitHub 问题)。这一成绩超越此前所有开源模型,领先优势超 6 个百分点。该基准不仅评估代码生成有效性,更能检验代码可否实际解决真实项目中的文档化问题。在相同 OpenHands 框架下,Devstral 的表现显著优于参数量更大的 Deepseek-V3-0324(6710 亿参数)和 Qwen3 232B-A22B,凸显了其效率优势。

 

Devstral 是基于 Mistral Small 3.1 模型微调而成。训练前移除了视觉编码器,形成完全基于文本的代码理解和生成模型。支持 12.8 万 token 的上下文窗口,可单次处理大型代码库或长对话。240 亿的参数规模使其兼具轻量级特性,开发者使用英伟达 RTX 4090 等消费级 GPU 或 32GB 内存的 Apple Silicon 设备即可本地运行,降低了敏感代码环境的使用门槛。

 

Mistral 采用宽松的 Apache 2.0 许可发布 Devstral,允许商业或非商业用途及修改再分发。模型可通过 Hugging FaceLM StudioOllamaKaggle 等平台获取,也可通过 Mistral 自己的 API(标识符 devstral-small-2505)调用。

 

社区中兴奋与审慎的反响并存。产品构建师 Nayak Satya 评论道:


Mistral 又一次带来了令人期待的升级。这家公司正为 AI 领域默默构建重要补充。当 Mistral 崛起时,欧洲在 AI 领域并不落后。顺便一问,能否将其集成到 VS Studio 等现代 IDE 中?

 

Reddit 的 r/LocalLLaMA 版块用户 Coding9 表示:


在 Cline 中的简单任务测试成功,难以置信!之前其他本地模型从来都没运行成功过,很快将尝试更复杂的任务。

 

尽管是以研究预览版发布,Devstral 标志着大语言模型在实际软件工程应用中的进步。Mistral 透露更大规模的版本已在开发中,后续版本将具备更先进能力。公司正邀请开发者社区提供反馈,以优化模型及其与软件工具生态的集成。

2025-05-28 14:003689

评论

发布
暂无评论

KubeNode:阿里巴巴云原生 容器基础设施运维实践

阿里巴巴云原生

阿里巴巴 容器 运维 云原生 k8s

前端开发:VS Code编辑器新建Vue文件自定义模板的方法

三掌柜

vue.js 大前端 3月日更

【最新】2021年Hive阶段最全面试真题-附答案

大数据技术指南

大数据 hive 面试 28天写作 3月日更

数据湖到底是什么?有什么用?这篇文章告诉你

关二爷大数据笔记

大数据 数据湖 实时数仓

终于学完国内算法第一人10年经验总结的数据结构与算法详解文档

Java架构之路

Java 程序员 架构 面试 编程语言

如何用一个月的时间啃完英语词典?

wbliu85

COPU助力北大研究生开源公选课丨开源PostgreSQL研发课程成功进入北京大学

PostgreSQLChina

数据库 postgresql 开源 开源社区

大作业

yoki

源码分析-Netty:开篇

程序员架构进阶

架构 源码分析 Netty 28天写作 3月日更

Flink的状态编程和容错机制

五分钟学大数据

大数据 flink 28天写作 3月日更

互联网人一天24小时在做些啥《打工人的那些事》

谙忆

【2021 ECUG Con】聚势而来,与你相约花开时

小剑客

区块链 云计算 大数据 开源 Go 语言

一周信创舆情观察(3.1~3.7)

统小信uos

最新蚂蚁五面、拼多多三面、字节四面(已入职拼多多),个人面经分享

Java架构之路

Java 程序员 架构 面试 编程语言

有钱人为什么配置加密货币?

CECBC

货币

数字经济时代,区块链能否担当产业数字化转型核心赋能者?

CECBC

数字经济

Elasticsearch Inverted Index

escray

elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

第六.产品经理的项目管理

让我思考一会儿

神了!终于有人把困扰我多年的Spring Boot讲明白了

架构 微服务 框架

2021年爆锤39K月薪Offer!阿里巴巴Java面试(知识点)整理

Java架构之路

Java 程序员 架构 面试 编程语言

新的RBAC:基于资源的权限管理(Resource-Based Access Control)

龙归科技

资源 权限管理 rbac

区块链与隐私计算保护数据产权,让个人隐私不再“裸奔”

CECBC

区块链

Flink SQL CDC 实践以及一致性分析

Apache Flink

flink

话说 类加载过程 第一篇

木子的昼夜

如何与下属沟通?

石云升

程序员 28天写作 职场经验 管理经验 3月日更

CloudQuery, 一款基于WEB的数据库客户端(转自杨建荣的工作笔记)

BinTools图尔兹

二分查找以及变体

一个大红包

3月日更

寻找被遗忘的勇气(十一)

Changing Lin

3月日更

外卖下单用例流程图

阿珍爱上阿强

git 教程 --git revert 命令

生之欢愉,时间同行

推荐一款小众且好用的 Python 爬虫库

星安果

Python 爬虫 RoboBrowser

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型_AI&大模型_InfoQ精选文章