50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

Windsurf 发布 SWE-1 系列模型,支持软件工程全流程任务

作者:Daniel Dominguez

  • 2025-05-22
    北京
  • 本文字数:1147 字

    阅读完需:约 4 分钟

大小:604.59K时长:03:26
Windsurf发布SWE-1系列模型,支持软件工程全流程任务

Windsurf 推出首批 SWE-1 模型,这些模型专为支持软件工程的全流程任务提供支持,不仅限于代码生成。该系列包括三个模型:SWE-1、SWE-1-lite 和 SWE-1-mini,每个模型都针对特定场景进行了设计。


SWE-1 专注于工具调用推理,性能与 Claude 3.5 Sonnet 相当,但在运营成本上更具优势。SWE-1-lite 替代了之前的 Cascade Base 模型,不仅提升了质量,而且对所有用户全面开放,无任何使用限制。SWE-1-mini 是一个紧凑型、高速的模型,在 Windsurf Tab 环境中启用了被动预测功能。


SWE 模型通过引入流程感知(flow awareness)框架来解决现有编码模型的局限性。这个框架使模型能够推理长期、多任务表面的工程任务,即便这些任务处于不完整或不断演变的状态。这些模型基于用户在 Windsurf 自有编辑器中的互动数据进行训练,并结合了来自终端、浏览器和用户反馈循环的上下文信息。


Windsurf 通过离线基准测试和盲生产实验对 SWE-1 的性能进行评估。基准测试包括:继续未完成的开发会话和端到端完成工程目标等任务。在这些任务中,SWE-1 的性能接近当前最先进的基础模型,并且优于开放权重和中等规模的替代方案。


在生产实验中,Windsurf 使用匿名模型测试来比较 SWE-1 在现实中的表现。一些指标(如用户每天接受的代码行数和编辑贡献率等)表明,SWE-1 在开发者中的使用率和留存率表现优异。SWE-1-lite 和 SWE-1-mini 的开发采用了与 SWE-1 类似的方法,其中 lite 针对中等性能,而 mini 则针对延迟敏感任务进行了优化。


所有模型均围绕共享时间线的概念构建,这一设计使得用户与 AI 能够在协作流程中共同推进任务。Windsurf 计划借助其集成开发环境生成的数据来扩展这一协作模式,并完善 SWE 系列模型。


社区对 SWE-1 系列模型的初步反馈表明其在软件工程任务中的全面性,而不仅仅局限于代码生成。开发者指出 SWE-1 的工具调用推理功能及其在不同开发环境中处理不完整工作流程的能力对他们来说非常有用。


Web 和应用开发者 Jordan Weinstein 表示:


到目前为止,SWE-1 表现非常出色,尽管在用 SWE-1 测试 Supabase MCP 时 Cascade 会报错。不过 lite 没有这个问题。


技术大神 Leonardo Gonzalez 表示:


大多数 AI 编码助手仅能覆盖开发者实际工作的 20%,而忽略了其余 80%。SWE-1 改变了这个游戏规则。


此次发布恰逢 OpenAI 收购 Windsurf,此举旨在加强其在巩固 OpenAI 在快速增长的 AI 驱动软件工程工具市场中的地位,竞争对手如 Anthropic 的 Claude微软的 GitHub Copilot 已经在该领域占据了重要份额。OpenAI 预计将把 Windsurf 的工程导向 AI 能力整合到自己的生态系统中,包括 ChatGPT 和 Codex 等平台,从而进一步扩大其在软件开发工具领域的影响力。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/05/windsurf-swe-models/

2025-05-22 11:156126

评论

发布
暂无评论

嘉为蓝鲸DevOps流水线工具如何为企业研发赋能?

嘉为蓝鲸

DevOps 流水线 蓝鲸

JMeter笔记8 | JMeter关联

测试 Jmeter 性能测试 自动化测试 接口测试

Velocity不用愁!Velocity系统的前端工程化之路 | 京东云技术团队

京东科技开发者

Java 前端工程化 Web H5 Velocity.js 企业号 5 月 PK 榜

涅槃重生!字节大牛力荐大型分布式手册,凤凰架构让你浴火成神

Java你猿哥

架构 Kubernetes 分布式 架构师 分布式架构

还在服务器上捞日志?试试这款可视化监控系统吧,真香!

Java你猿哥

Java 日志 ssm 监控系统 Frostmourne

现代应用开发模式:PWA vs 小程序

Onegun

小程序 PWA

理解JVM工作机制(二) 对象的创建

Geek漫游指南

Java JVM Java web

面试官:怎么保证Kafka的消息不丢失

Java kafka 面试 消息队列 消息中间件

阿里SpringBoot实战手册横空出世!从此不再是易学难精

Java spring 微服务 Spring Boot 框架

使用 PAI-Blade 优化 Stable Diffusion 推理流程(二)

阿里云大数据AI技术

人工智能 优化 推理 Stable Diffusion 企业号 5 月 PK 榜

GitHub上13个高赞Java项目推荐,会一个就能跟面试官谈笑风生

Java你猿哥

Java 微服务 秒杀系统 网约车项目 java项目

软件测试丨SeleniumIDE 自动化用例录制、测试用例结构分析

测试人

软件测试 自动化测试 测试开发 测试用例 selenium

JMeter笔记7 | JMeter脚本回放

测试 Jmeter 性能测试 自动化测试 接口测试

40亿个QQ号,限制1G内存,如何去重?

Java你猿哥

Java ssm 布隆过滤器 BitMap 过滤器

SpringBoot 中实现定时任务的几种方式

Java Spring Boot

不吹不黑!阿里新产微服务架构进阶笔记我粉了!理论实战齐飞

Java 架构 微服务 Spring Cloud

【云计算】谷歌云是国外的吗?是公有云还是私有云?

行云管家

公有云 私有云 谷歌云

百度工程师移动开发避坑指南——Swift语言篇

百度Geek说

swift 移动端 开发语言 企业号 5 月 PK 榜

我用ChatGPT,给RabbitMQ加了个连接池

Java你猿哥

Java 源码 ssm RabbitMQ ChatGPT

发挥数据价值!数据驱动的日志解析与异常检测方法介绍!

嘉为蓝鲸

日志分析 管理日志 日志统计

火山引擎多云安全平台,破解多云异构场景下的安全挑战

科技热闻

开源赋能 普惠未来|XuperCore诚邀您参与2023开放原子全球开源峰会

开放原子开源基金会

开源

AntDB数据库参加开源数据库技术沙龙,分享全栈业务能力

亚信AntDB数据库

AntDB AntDB数据库 企业号 5 月 PK 榜

实例解读华为云数字工厂平台的逻辑模型编排器

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

嘉为蓝鲸CMP多云管理平台解决方案成功入选!

嘉为蓝鲸

多云管理 IT运维 蓝鲸

开源赋能 普惠未来|铜锁/Tongsuo诚邀您参与2023开放原子全球开源峰会

开放原子开源基金会

开源

为什么老有人想让我们“程序员”失业?征文获奖作品合集

InfoQ写作社区官方

技术专题合集 热门活动 三周年征文

背完这套Java面试八股文,自动解锁面试牛逼症被动技能

Java你猿哥

MySQL redis java面试 java基础 分布式微服务

又爆神作!阿里首发并发编程神仙笔记,差距不止一点点

Java 并发编程

等保和网络安全法的关系是什么?怎么理解?

行云管家

网络安全 等保 等级保护

Windsurf发布SWE-1系列模型,支持软件工程全流程任务_AI&大模型_InfoQ精选文章