写点什么

SAM 3 推出更强大的分割架构,面向现代视觉工作流程

作者:Robert Krzaczyński

  • 2025-12-01
    北京
  • 本文字数:911 字

    阅读完需:约 3 分钟

大小:449.45K时长:02:33
SAM 3 推出更强大的分割架构,面向现代视觉工作流程

Meta 发布了 SAM 3,这是其 Segment Anything Model 的最新版本,也是自项目首次亮相以来最大的一次更新。SAM 3 是为提供更稳定、更具上下文理解能力的分割能力,在精度、边界质量以及对真实场景的鲁棒性上都有全面提升,目标是让分割在科研与生产系统中更加可靠。

 

经过架构重构的 SAM 3 能够更好地处理细微结构、重叠物体以及模糊区域。早期版本中稍显薄弱的小目标和杂乱场景下,新版掩码一致性更高。本次更新还引入了重新构建的训练数据集,以提升覆盖范围,并减少在非常规光照、遮挡等困难条件下的失败情况。

 

性能方面也得到强化。SAM 3 在 GPU 和移动级硬件上都实现了更快的推理速度,降低了交互式使用和批处理的延迟。模型提供了为 PyTorch、ONNX 以及 Web 运行环境优化的推理版本,反映出该系统已被广泛应用于浏览器、创意工具和机器人流程中。这些集成是为简化部署,让用户无需对现有工作流进行大幅改造。

 

此次更新的另一个重点是提升了上下文理解能力。SAM 3 不再局限于空间边界,更是加入了能够解析场景中物体间关系的机制。因此,分割结果更接近人类对物体完整性的感知,这对于依赖更干净、更具语义性掩码的下游任务而言很有帮助。

 

研究团队指出,这次更新让 SAM 更加接近一种多模态系统中的通用基础组件,在当前技术生态中,分割正从一个专用模块演变为基础设施能力。

 

社区反馈褒贬不一但非常务实。有 Reddit 用户评论

感觉更像是一次软件更新,而不是新模型。


另一位用户则是点出了其能力的变动:

SAM2 里的文本提示功能很像是半成品,公开模型压根不支持。现在公开模型似乎有了支持,这对很多从业者来说是很大的进步。

 

除了交互式应用之外,SAM 3 还面向更广泛的下游场景,包括 AR/VR 场景理解、科学成像、视频编辑、自动标注以及机器人感知等。Meta 将该模型定位为一个自然融入现有视觉流水线的组件,而无需专门基础设施或特定任务训练。

 

SAM 3 现已以开源形式发布,包含模型权重、文档与部署示例。凭借更强的架构与更广的平台兼容性,此次发布进一步巩固了 SAM 在科研与工业领域作为通用分割工具的作用。感兴趣的读者可以查阅官方文档,了解从模型设计到数据集构建的更多细节。


原文链接:

https://www.infoq.com/news/2025/11/meta-sam3/

2025-12-01 14:003982

评论

发布
暂无评论

2023飞书未来无限大会谢欣演讲highlight:三件套、Office提升、出海

B Impact

聊聊池化层和步长为2的卷积层

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 3 月 PK 榜 卷积层

手把手教你如何使用MyBatisPlus

Java你猿哥

mybatis 实战 Mybatis-Plus

精华抢先看|龙蜥社区操作系统安全两大白皮书即将重磅发布

OpenAnolis小助手

操作系统 白皮书 系统安全 Meetup 龙蜥社区

电力行业等保定级评级依据是什么?分为几个等级?

行云管家

电力 等保 等保测评

一站式管理多平台小程序的办法

Onegun

微信小程序 小程序管理平台 小程序管理

如何防止AD域环境遭受恶意攻击?

嘉为蓝鲸

AD #运维

矩阵佛萨奇(MetaForce)合约开发源码搭建

薇電13242772558

web3

ITSM | 如何通过设计提升工单处理效率

嘉为蓝鲸

IT ITSM 流程管理

JAVA实战:如何让单元测试覆盖率达到80%甚至以上

Java你猿哥

Java ssm 单元测试 Java工程师 java实战

软件测试/测试开发丨app自动化测试之Appium 源码修改定制分析

测试人

软件测试 自动化测试 测试开发 appium

HummerRisk 使用教程:k8s检测

HummerCloud

开发和测试融合,到底该怎么做?

BY林子

敏捷开发 敏捷测试

大数据计算引擎 EasyMR:拥抱开源,引领技术创新

袋鼠云数栈

大数据 大数据基础平台

BugBuilder: 高质量大规模缺陷库自动构建方法

华为云开发者联盟

开发 华为云 补丁 华为云开发者联盟 企业号 3 月 PK 榜

2023年实用性好的堡垒机推荐

行云管家

网络安全 堡垒机

赋能数字经济新动能 焱融科技获评「人工智能高质量发展-行业责任担当」企业

焱融科技

人工智能 文件存储 容器存储 分布式文件存储 全闪存储

ChatGPT能否取代程序员?仍然是一个需要认真探讨的问题,对此你怎么看?

兴科Sinco

OpenAPI openai #人工智能 ChatGPT

MySQL中这14个小玩意,让人眼前一亮!

Java你猿哥

Java MySQL 后端 ssm Java工程师

瓴羊Quick BI数据门户,让管理企业像浏览网页一样轻松

对不起该用户已成仙‖

【活动报名】 拥抱公平《 Impact Tech, She Can 》

亚马逊云科技 (Amazon Web Services)

人工智能

gRPC快速整合SpringCloud

Java你猿哥

Java gRPC Spring Cloud 后端 ssm

优秀!阿里甩出GC面试小册,仅7天Github获赞96.9K

Java你猿哥

Java ssm 面经 GC Java工程师

低代码开发平台如何推动企业数字化转型

力软低代码开发平台

开门见山|首期《崖山论“见”》技术 Meetup启程

YashanDB

模型训练过程中,混合精度训练稳定性解决方案

Openlab_cosmoplat

模型训练 开源社区

直击面试!阿里技术官手码12W字面试小册在Github上爆火

Java你猿哥

Java 后端 面经 简历 Java工程师

蛇形走线用在哪里,一文告诉你

华秋PCB

信号 PCB PCB设计 布线 滤波

记一次 rr 和硬件断点解决内存踩踏问题

NebulaGraph

数据库 debug

SAM 3 推出更强大的分割架构,面向现代视觉工作流程_架构_InfoQ精选文章