10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

作者:Daniel Dominguez

  • 2025-05-28
    北京
  • 本文字数:1046 字

    阅读完需:约 3 分钟

大小:535.19K时长:03:02
Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型

Mistral AI 宣布推出 Devstral,一款与 All Hands AI 合作开发的新型开源大语言模型。该模型是为提升软件工程工作流的自动化水平,特别适用于需要跨多文件和多组件进行推理的复杂编码环境。与仅提供优化的代码补全函数生成等独立任务的模型不同,Devstral 通过代码智能体框架在整个代码库层面运作,专为解决实际编程问题而设计。

 

作为新一代智能体语言模型,Devstral 不仅能生成代码,更能根据具体任务执行上下文相关操作。这种智能体架构使模型能够:跨文件进行迭代修改、探索代码库、在最小人工干预下提出错误修复或新功能建议。这些能力契合现代软件工程需求:理解项目结构和依赖关系与编写语法正确的代码同等重要。

 

据 Mistral 内部评估,Devstral 在 SWE-Bench Verified 基准测试中获得 46.8% 的得分(该测试包含 500 个经人工筛选的 GitHub 问题)。这一成绩超越此前所有开源模型,领先优势超 6 个百分点。该基准不仅评估代码生成有效性,更能检验代码可否实际解决真实项目中的文档化问题。在相同 OpenHands 框架下,Devstral 的表现显著优于参数量更大的 Deepseek-V3-0324(6710 亿参数)和 Qwen3 232B-A22B,凸显了其效率优势。

 

Devstral 是基于 Mistral Small 3.1 模型微调而成。训练前移除了视觉编码器,形成完全基于文本的代码理解和生成模型。支持 12.8 万 token 的上下文窗口,可单次处理大型代码库或长对话。240 亿的参数规模使其兼具轻量级特性,开发者使用英伟达 RTX 4090 等消费级 GPU 或 32GB 内存的 Apple Silicon 设备即可本地运行,降低了敏感代码环境的使用门槛。

 

Mistral 采用宽松的 Apache 2.0 许可发布 Devstral,允许商业或非商业用途及修改再分发。模型可通过 Hugging FaceLM StudioOllamaKaggle 等平台获取,也可通过 Mistral 自己的 API(标识符 devstral-small-2505)调用。

 

社区中兴奋与审慎的反响并存。产品构建师 Nayak Satya 评论道:


Mistral 又一次带来了令人期待的升级。这家公司正为 AI 领域默默构建重要补充。当 Mistral 崛起时,欧洲在 AI 领域并不落后。顺便一问,能否将其集成到 VS Studio 等现代 IDE 中?

 

Reddit 的 r/LocalLLaMA 版块用户 Coding9 表示:


在 Cline 中的简单任务测试成功,难以置信!之前其他本地模型从来都没运行成功过,很快将尝试更复杂的任务。

 

尽管是以研究预览版发布,Devstral 标志着大语言模型在实际软件工程应用中的进步。Mistral 透露更大规模的版本已在开发中,后续版本将具备更先进能力。公司正邀请开发者社区提供反馈,以优化模型及其与软件工具生态的集成。

2025-05-28 14:003469

评论

发布
暂无评论

pyinstaller 打包

橙橙橙橙汁丶

带你全面了解 Git 系列 02 - 常用 Git 技巧

淼💦 淼

git GitHub

01-架构的定义

Lane

架构师实战营 模块九总结

代廉洁

架构实战营

Discourse 图片上传的更新

HoneyMoose

Cobra 快速入门 - 专为命令行程序而生

xcbeyond

cobra Go 语言 8月日更

Java中的JVM是如何实现多线程的?

程序员阿杜

Java JVM 多线程 8月日更

架构训练营模块 2 作业 - 学生信息管理系统的架构文档 - 江哲

江哲

架构师实战营 模块九作业(设计电商秒杀系统)

代廉洁

架构实战营

网络攻防学习笔记 Day92

穿过生命散发芬芳

网络攻防 8月日更

八月未央,早睡早起

escray

读书笔记 8月日更

docker个人理解与安装

小鲍侃java

8月日更

菜鸡学习python

Augus

8月日更

架构实战营毕业总结

白发青年

#架构实战营

聊聊实时数仓架构设计

水滴

实时数仓 数仓架构 8月日更 数仓建设思路

手把手撸二叉树之叶子相似的树

HelloWorld杰少

面试 大前端 二叉树 数据结构与算法 8月日更

服装生产流程管理在明道云的实现

明道云

Java 代理模式

gin

Java 代理 Proxy

01 设计模式之单例模式

陈皮的JavaLib

设计模式 单例模式 8月日更

【前端 · 面试 】HTTP 总结(一)—— HTTP 概述

编程三昧

面试 大前端 HTTP 8月日更

架构实战营-毕业设计

泄矢的呼啦圈

架构实战营

李运华老师(前阿里P9)架构实战营 毕业总结

代廉洁

架构实战营

爱你的人,会管着你。而不是惯着你。

石云升

娱乐圈 8月日更 刑法

非典型开发者的形象三变

脑极体

毕业设计-秒杀业务

白发青年

架构实战营

现代分布式架构设计原则-可靠性

松先生

稳定性 可用性 弹性 可靠性

「SQL数据分析系列」13. 索引和约束

Databri_AI

sql 索引 位图

Python OpenCV 图像处理之傅里叶变换,取经之旅第 52 篇

梦想橡皮擦

8月日更

架构实战营-毕业总结

大可

Convolutional Neural Network (CNN)

毛显新

神经网络 深度学习 tensorflow 图像识别

gopher成长之路(二):听万俊峰老师演讲有感

非晓为骁

学习 个人成长 gopher

Mistral 发布 Devstral:一款面向软件工程智能体的开源大语言模型_AI&大模型_InfoQ精选文章