大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

Anthropic 提出透明度框架以保障前沿 AI 发展

作者:Daniel Dominguez

  • 2025-07-30
    北京
  • 本文字数:1093 字

    阅读完需:约 4 分钟

大小:550.38K时长:03:07
Anthropic提出透明度框架以保障前沿AI发展

Anthropic 提出了一个新的透明度框架,旨在解决在前沿 AI 模型开发过程中日益增长的问责需求。这一提议的重点针对正在开发强大 AI 模型的大型人工智能公司,这些公司是以计算能力、成本、评估性能和年度研发支出等因素来区分的。目标是建立一套标准,以确保安全,降低风险,并提高公众对这些先进 AI 系统的开发和部署的可见度。

 

框架的一个核心方面是实施安全开发框架(Secure Development Frameworks,SDFs),这将要求大型 AI 公司评估和减轻与其模型相关的潜在灾难性风险。这些风险包括化学的、生物的及放射性的危害,以及由模型自主性错位造成的伤害。该提案概述了这些框架不仅应解决风险缓解问题,还应确保负责任地处理 AI 开发流程。

 

该框架的一个关键要求是公开披露。根据提议的法规,AI 公司将被要求通过注册网站公开其SDFs,提供对其安全实践的透明度。这将允许研究人员、政府和公众获取有关部署模型的重要信息,确保安全标准得到满足,并妥善管理任何风险。此外,公司还需要发布系统卡片,提供模型测试程序、评估结果和实施的缓解措施的摘要。每当模型被修订或添加新功能时,这些文件都需要更新。

 

该框架还建议小型开发人员和初创公司不受这些要求的限制。相反,这些法规将适用于有潜力造成重大伤害的大规模 AI 公司,例如那些拥有大量计算能力或财务资源的公司。豁免旨在避免给小型公司带来不当负担,同时仍将监管工作集中在该领域最大的参与者身上。

 

此外,提议包括执行合规的具体条款。如果 AI 公司就其遵守框架的情况提供虚假或误导性陈述,将构成违法行为,确保必要时可以应用举报人保护。执法机制将允许司法部长对违规行为追究民事处罚,帮助维护系统的完整性。

 

社区的反应反映了对最近全球关于 AI 监管讨论的乐观、怀疑和实际关切的担忧。

 

AI 专家Himanshu Kumar在 X 上发表评论:

 

促进开源 AI 开发对安全创新不也是至关重要的吗?

 

与此同时,用户Skeptical Observer也发表了评论:

 

由谁来执行?这感觉非常以美国为中心。中国的实验室或其他范围之外的呢?举报人保护听起来不错,但没有全球覆盖,这只是权宜之计。希望他们在 AI 安全峰会上澄清这一点!

 

最终,提议的透明度框架旨在在确保AI安全和促进持续创新之间取得平衡。虽然框架为透明度设定了最低标准,但它故意避免过于规范,允许 AI 行业随着技术的发展而不断适应。通过促进透明度,该框架寻求为 AI 开发人员建立清晰的问责制,帮助政策制定者和公众区分该领域负责任的和不负责任的做法。这可以作为进一步监管的基础,如果需要的话,提供必要的证据和见解,以确定随着人工智能模型的发展是否需要额外的监督。

 

原文链接:

https://www.infoq.com/news/2025/07/anthropic-transparency-framework/

2025-07-30 12:001

评论

发布
暂无评论

工业数据治理范式革新:TDengine虚拟表技术解析

TDengine

数据库 tdengine 时序数据库

暖春启幕,巨擘齐聚!2025慕尼黑上海电子展开幕首日盛况直击

极客天地

蔚来汽车智能座舱接入通义大模型,并使用通义灵码全面提效

阿里云云效

阿里云 云原生 通义灵码

教学资源管理系统的测试

北京木奇移动技术有限公司

软件外包公司 出版社 教学资源网

项目管理工具:Jira vs Leangoo

axe

Jira 项目管理工具 办公软件 leangoo

互联网服务行业怎么定义?需要用到堡垒机吗?

行云管家

网络安全 数据安全 堡垒机

利用 DeepSeek-R1 模型和计算机视觉微调模型实现马铃薯叶片疾病识别和分类

亚马逊云科技 (Amazon Web Services)

新客户 | 美妆智造全面升级:毫秒级查询 + 极致压缩

TDengine

数据库 tdengine 时序数据库

从理论到落地:MCP 实战解锁 AI 应用架构新范式 | 免费领取 78 页完整 PPT

阿里巴巴云原生

阿里云 云原生 MCP

AI超级计算机来了

PowerVerse

AI nvidia 芯片

三维模型怎么剖切?三维剖切详细教程来了

在路上

cad cad看图 CAD看图王

扫雷行动派|狄耐克服务万里不停歇,以Ai相伴到万家

新消费日报

图床

九叔(高翔龙)

3月报|DolphinScheduler项目进展一览

白鲸开源

开源 Apache DolphinScheduler

「摩根士丹利」最新人形机器人研报:头部人形机器人公司梳理和趋势分析(附报告)

机器人头条

科技 大模型 人形机器人 具身智能

《Operating System Concepts》阅读笔记:p700-p732

codists

操作系统

教学资源管理系统的运营维护

北京木奇移动技术有限公司

软件外包公司 出版社 教学资源管理

CAD图纸中插入图块的详细步骤与技巧

在路上

cad cad看图 CAD看图王

五个信创小知识汇总-行云管家

行云管家

信创 堡垒机 国产化

21日报名截止!CommunityOverCode Asia 2025议题征集倒计时

白鲸开源

开源 Apache DolphinScheduler community

不到一首歌的时间,AppStudio助你快速搭建 AI 智能体应用!

商汤万象开发者

人工智能 AI

第87期 | GPTSecurity周报

云起无垠

CloudWeGo + APMPlus:打造从开发到可观测的一站式体验

火山引擎开发者社区

分布式架构 火山引擎

大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台

阿里云大数据AI技术

云计算 阿里云 大模型 rag AI搜索

Unity 广告质量监测工具免费开放 三大指标破解变现与体验的平衡难题

极客天地

蔚来汽车智能座舱接入通义大模型,并使用通义灵码全面提效

阿里巴巴云原生

阿里云 云原生 通义灵码

SpringAI版本更新:向量数据库不可用的解决方案!

王磊

企业数字化转型失败频率为什么这么高?

积木链小链

数字化转型 数字化 智能制造

用户行为分析正在被保险行业广泛采纳-ClkLog埋点分析系统

ClkLog

开源 数据分析 画像 埋点分析

修改下内存配置,DolphinScheduler CPU飙升问题秒解决

白鲸开源

开源 Apache DolphinScheduler 用户案例

金融行业数字化转型破局:WhaleScheduler如何重塑万级任务调度体系?

白鲸开源

白鲸开源 WhaleStudio 商业案例

Anthropic提出透明度框架以保障前沿AI发展_管理/文化_InfoQ精选文章