写点什么

Windsurf 发布 SWE-1 系列模型,支持软件工程全流程任务

作者:Daniel Dominguez

  • 2025-05-22
    北京
  • 本文字数:1147 字

    阅读完需:约 4 分钟

大小:604.59K时长:03:26
Windsurf发布SWE-1系列模型,支持软件工程全流程任务

Windsurf 推出首批 SWE-1 模型,这些模型专为支持软件工程的全流程任务提供支持,不仅限于代码生成。该系列包括三个模型:SWE-1、SWE-1-lite 和 SWE-1-mini,每个模型都针对特定场景进行了设计。


SWE-1 专注于工具调用推理,性能与 Claude 3.5 Sonnet 相当,但在运营成本上更具优势。SWE-1-lite 替代了之前的 Cascade Base 模型,不仅提升了质量,而且对所有用户全面开放,无任何使用限制。SWE-1-mini 是一个紧凑型、高速的模型,在 Windsurf Tab 环境中启用了被动预测功能。


SWE 模型通过引入流程感知(flow awareness)框架来解决现有编码模型的局限性。这个框架使模型能够推理长期、多任务表面的工程任务,即便这些任务处于不完整或不断演变的状态。这些模型基于用户在 Windsurf 自有编辑器中的互动数据进行训练,并结合了来自终端、浏览器和用户反馈循环的上下文信息。


Windsurf 通过离线基准测试和盲生产实验对 SWE-1 的性能进行评估。基准测试包括:继续未完成的开发会话和端到端完成工程目标等任务。在这些任务中,SWE-1 的性能接近当前最先进的基础模型,并且优于开放权重和中等规模的替代方案。


在生产实验中,Windsurf 使用匿名模型测试来比较 SWE-1 在现实中的表现。一些指标(如用户每天接受的代码行数和编辑贡献率等)表明,SWE-1 在开发者中的使用率和留存率表现优异。SWE-1-lite 和 SWE-1-mini 的开发采用了与 SWE-1 类似的方法,其中 lite 针对中等性能,而 mini 则针对延迟敏感任务进行了优化。


所有模型均围绕共享时间线的概念构建,这一设计使得用户与 AI 能够在协作流程中共同推进任务。Windsurf 计划借助其集成开发环境生成的数据来扩展这一协作模式,并完善 SWE 系列模型。


社区对 SWE-1 系列模型的初步反馈表明其在软件工程任务中的全面性,而不仅仅局限于代码生成。开发者指出 SWE-1 的工具调用推理功能及其在不同开发环境中处理不完整工作流程的能力对他们来说非常有用。


Web 和应用开发者 Jordan Weinstein 表示:


到目前为止,SWE-1 表现非常出色,尽管在用 SWE-1 测试 Supabase MCP 时 Cascade 会报错。不过 lite 没有这个问题。


技术大神 Leonardo Gonzalez 表示:


大多数 AI 编码助手仅能覆盖开发者实际工作的 20%,而忽略了其余 80%。SWE-1 改变了这个游戏规则。


此次发布恰逢 OpenAI 收购 Windsurf,此举旨在加强其在巩固 OpenAI 在快速增长的 AI 驱动软件工程工具市场中的地位,竞争对手如 Anthropic 的 Claude微软的 GitHub Copilot 已经在该领域占据了重要份额。OpenAI 预计将把 Windsurf 的工程导向 AI 能力整合到自己的生态系统中,包括 ChatGPT 和 Codex 等平台,从而进一步扩大其在软件开发工具领域的影响力。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/05/windsurf-swe-models/

2025-05-22 11:155836

评论

发布
暂无评论

YashanDB 知识库|STATISTICS_LEVEL 设置为 ALL,性能掉到冰点?一条参数搞清楚根因

数据库砖家

数据库

从AI助手到个性化数字分身:WeClone & Second Me打造本地化、私有化的个性化AI代理系统

汀丶人工智能

人工智能

《算法导论(第4版)》阅读笔记:p14-p16

codists

算法

城市感知网络体系,构筑全域数字化新基石

脑极体

AI

这款AI助手竟能自动生成行程+前端代码?

VyrnSynx

CodeBuddy首席试玩官

从0到上线,CodeBuddy 如何帮我快速构建旅游 App?

VyrnSynx

CodeBuddy首席试玩官

PMC必须要懂的四个关键流程:生产、库存、交期全过程解析!

积木链小链

制造业 智能制造 中小企业 生产管理

什么是DDoS攻击?

天翼云开发者社区

安全 DDoS

阿里Java开发手册:编程规约、异常日志、单元测试、安全规 约、MySQL 数据库、工程结构、设计规约!

程序员高级码农

Java 程序员 java 技术提升

莫想到有一天得重新写个 etcd client

八苦-瞿昙

uniapp跨平台开发HarmonyOS NEXT应用初体验

幽蓝计划

鸿蒙跨平台开发

现代框架对SEO的深度影响

溪抱鱼

国际化 SEO SEO工具

AI实践探索:辅助生成测试用例

巫山老妖

测试用例 AI编程

连锁药店如何安全访问总部运营系统?贝锐花生壳带来解决方案

贝锐

内网穿透 ERP

需求分析不好做?这门华为新课免费试听!

YG科技

用 CodyBuddy 帮我写自动化运维脚本

悟空聊架构

AI 悟空聊架构 CodeBuddy首席试玩官

uniapp开发HarmonyOS NEXT应用之项目结构详细解读

幽蓝计划

TikTok直播卡顿怎么解决?教你几个方法!

Ogcloud

SD-WAN tiktok直播 tiktok直播网络 tiktok网络 sd-wan专线

Ava:6 分钟语音聊天免费生成 MBTI 报告;字节发布图像理解与生成统一模型 Mogao丨日报

声网

Apollo 可观测性最佳实践

观测云

Apollo

常见应用层DDoS攻击

天翼云开发者社区

安全 DDoS

100台电脑局域网搭建攻略和设备配置指南

Ogcloud

局域网 企业组网 局域网组建 局域网搭建 企业网络搭建

手动开发?给我一条提示词,CodeBuddy能做的你都做不到!

VyrnSynx

CodeBuddy首席试玩官

使用LLaMA-Factory快速训练自己的专用大模型

我再BUG界嘎嘎乱杀

人工智能 AI 大模型

什么是AI大模型?看deepseek用通俗易懂的语言解释

我再BUG界嘎嘎乱杀

人工智能 AI AI大模型 大模型 大语言模型

闺蜜机行业市场销量涨超42%,小度科技持续领跑行业

科技大数据

11.多用组合和少继承

杨充

AI工具如何一键生成图表?5个流行的图表生成软件盘点!

职场工具箱

人工智能 图表 AI软件 AIGC 可视化工具

室内LED全彩显示屏P3与P5

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏 规格说明

越来越多企业为AI焦虑,联想的“超级智能体”来得正是时候

Alter

阿里云 SLS 多云日志接入最佳实践:链路、成本与高可用性优化

阿里巴巴云原生

阿里云 云原生

Windsurf发布SWE-1系列模型,支持软件工程全流程任务_AI&大模型_InfoQ精选文章