把握行业变革关键节点,12 月 19 日 - 20 日,AICon北京站即将重磅启幕! 了解详情
写点什么

SAM 3 推出更强大的分割架构,面向现代视觉工作流程

作者:Robert Krzaczyński

  • 2025-12-01
    北京
  • 本文字数:911 字

    阅读完需:约 3 分钟

大小:449.45K时长:02:33
SAM 3 推出更强大的分割架构,面向现代视觉工作流程

Meta 发布了 SAM 3,这是其 Segment Anything Model 的最新版本,也是自项目首次亮相以来最大的一次更新。SAM 3 是为提供更稳定、更具上下文理解能力的分割能力,在精度、边界质量以及对真实场景的鲁棒性上都有全面提升,目标是让分割在科研与生产系统中更加可靠。

 

经过架构重构的 SAM 3 能够更好地处理细微结构、重叠物体以及模糊区域。早期版本中稍显薄弱的小目标和杂乱场景下,新版掩码一致性更高。本次更新还引入了重新构建的训练数据集,以提升覆盖范围,并减少在非常规光照、遮挡等困难条件下的失败情况。

 

性能方面也得到强化。SAM 3 在 GPU 和移动级硬件上都实现了更快的推理速度,降低了交互式使用和批处理的延迟。模型提供了为 PyTorch、ONNX 以及 Web 运行环境优化的推理版本,反映出该系统已被广泛应用于浏览器、创意工具和机器人流程中。这些集成是为简化部署,让用户无需对现有工作流进行大幅改造。

 

此次更新的另一个重点是提升了上下文理解能力。SAM 3 不再局限于空间边界,更是加入了能够解析场景中物体间关系的机制。因此,分割结果更接近人类对物体完整性的感知,这对于依赖更干净、更具语义性掩码的下游任务而言很有帮助。

 

研究团队指出,这次更新让 SAM 更加接近一种多模态系统中的通用基础组件,在当前技术生态中,分割正从一个专用模块演变为基础设施能力。

 

社区反馈褒贬不一但非常务实。有 Reddit 用户评论

感觉更像是一次软件更新,而不是新模型。


另一位用户则是点出了其能力的变动:

SAM2 里的文本提示功能很像是半成品,公开模型压根不支持。现在公开模型似乎有了支持,这对很多从业者来说是很大的进步。

 

除了交互式应用之外,SAM 3 还面向更广泛的下游场景,包括 AR/VR 场景理解、科学成像、视频编辑、自动标注以及机器人感知等。Meta 将该模型定位为一个自然融入现有视觉流水线的组件,而无需专门基础设施或特定任务训练。

 

SAM 3 现已以开源形式发布,包含模型权重、文档与部署示例。凭借更强的架构与更广的平台兼容性,此次发布进一步巩固了 SAM 在科研与工业领域作为通用分割工具的作用。感兴趣的读者可以查阅官方文档,了解从模型设计到数据集构建的更多细节。


原文链接:

https://www.infoq.com/news/2025/11/meta-sam3/

2025-12-01 14:003

评论

发布
暂无评论

把LangChain跑起来的3个方法 | 京东云技术团队

京东科技开发者

人工智能 LLM langchain 企业号 7 月 PK 榜

ChatGPT越来越火,大厂体验设计师纷纷“毕业”?

博文视点Broadview

Python案例分析|21点扑克牌游戏 | 社区征文

TiAmo

Python 数据分析 年中技术盘点 21点扑克游戏

浪潮信息直播高能预告!令人感兴趣的高性能架构、CXL技术、数据库等硬件相关技术分享来了 | 第 83-85 期

OpenAnolis小助手

开源 高性能架构 龙蜥大讲堂 RDMA 浪潮信息

inBuilder今日分享丨系统集成系列之异构接入

inBuilder低代码平台

集成

语音房源码搭建技术分享之降噪功能详解

山东布谷科技

软件开发 源码搭建 语音房源码 语音房

软件测试/测试开发丨函数式编程学习笔记

测试人

Python 程序员 软件测试 函数式

ReentrantLock源码解析 | 京东云技术团队

京东科技开发者

线程 企业号 7 月 PK 榜 并发问题

融云观察:社交大佬发家史,模仿才是终极成功学密码?

融云 RongCloud

微信 网络 通信 社交 场景

为了娃的暑期课,老父亲竟然用上了阿里云高大上的 Serverless FaaS!!!

WuKongCoder

云计算 阿里云 Serverless

实战一个自己用的node-cli

互联网工科生

Vue Node cli

时序数据库 TDengine 与 DBeaver 达成合作,生态系统再壮大

爱倒腾的程序员

涛思数据 tdengine 时序数据库

大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

火山引擎 DataLeap 构建Data Catalog系统的实践(一):背景与调研思路

字节跳动数据平台

如何自动化测试你的接口?—— Rest Assured

不在线第一只蜗牛

自动化 自动化测试 API

可信数据库大会,不见不散!

KaiwuDB

KaiwuDB 2023可信数据库发展大会

腾讯云DSQL-C MYSQL 版本测评

查拉图斯特拉说

MySQL sql 腾讯云

技术分享| 融合通讯的架构介绍

anyRTC开发者

音视频 MCU mesh SFU 融合通讯

HarmonyOS极客松“上分秘籍”! 高手们顶峰相见!

HarmonyOS开发者

HarmonyOS

对线面试官-Redis(五 为什么这么快为什么能抗住高并发)

派大星

Java 面试题

Spring容器获取Bean的9种方式 | 京东云技术团队

京东科技开发者

spring Spring Boot bean 企业号 7 月 PK 榜

早8人的效率工具六件套

树上有只程序猿

EMAS热修复Sophix适配App加固的技术方案

移动研发平台EMAS

阿里云EMAS 移动热修复 app热修复 app加固

国内首批!腾讯云EdgeOne通过信通院边缘计算最新评估

极客天地

Net DB Web多级缓存的实现

不在线第一只蜗牛

HTTP net web api

分布式事务的几种实现方式 | 京东云技术团队

京东科技开发者

事务 分布式, 企业号 7 月 PK 榜

SAM 3 推出更强大的分割架构,面向现代视觉工作流程_架构_InfoQ精选文章