50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

Anthropic 提出透明度框架以保障前沿 AI 发展

作者:Daniel Dominguez

  • 2025-07-30
    北京
  • 本文字数:1093 字

    阅读完需:约 4 分钟

大小:550.38K时长:03:07
Anthropic提出透明度框架以保障前沿AI发展

Anthropic 提出了一个新的透明度框架,旨在解决在前沿 AI 模型开发过程中日益增长的问责需求。这一提议的重点针对正在开发强大 AI 模型的大型人工智能公司,这些公司是以计算能力、成本、评估性能和年度研发支出等因素来区分的。目标是建立一套标准,以确保安全,降低风险,并提高公众对这些先进 AI 系统的开发和部署的可见度。

 

框架的一个核心方面是实施安全开发框架(Secure Development Frameworks,SDFs),这将要求大型 AI 公司评估和减轻与其模型相关的潜在灾难性风险。这些风险包括化学的、生物的及放射性的危害,以及由模型自主性错位造成的伤害。该提案概述了这些框架不仅应解决风险缓解问题,还应确保负责任地处理 AI 开发流程。

 

该框架的一个关键要求是公开披露。根据提议的法规,AI 公司将被要求通过注册网站公开其SDFs,提供对其安全实践的透明度。这将允许研究人员、政府和公众获取有关部署模型的重要信息,确保安全标准得到满足,并妥善管理任何风险。此外,公司还需要发布系统卡片,提供模型测试程序、评估结果和实施的缓解措施的摘要。每当模型被修订或添加新功能时,这些文件都需要更新。

 

该框架还建议小型开发人员和初创公司不受这些要求的限制。相反,这些法规将适用于有潜力造成重大伤害的大规模 AI 公司,例如那些拥有大量计算能力或财务资源的公司。豁免旨在避免给小型公司带来不当负担,同时仍将监管工作集中在该领域最大的参与者身上。

 

此外,提议包括执行合规的具体条款。如果 AI 公司就其遵守框架的情况提供虚假或误导性陈述,将构成违法行为,确保必要时可以应用举报人保护。执法机制将允许司法部长对违规行为追究民事处罚,帮助维护系统的完整性。

 

社区的反应反映了对最近全球关于 AI 监管讨论的乐观、怀疑和实际关切的担忧。

 

AI 专家Himanshu Kumar在 X 上发表评论:

 

促进开源 AI 开发对安全创新不也是至关重要的吗?

 

与此同时,用户Skeptical Observer也发表了评论:

 

由谁来执行?这感觉非常以美国为中心。中国的实验室或其他范围之外的呢?举报人保护听起来不错,但没有全球覆盖,这只是权宜之计。希望他们在 AI 安全峰会上澄清这一点!

 

最终,提议的透明度框架旨在在确保AI安全和促进持续创新之间取得平衡。虽然框架为透明度设定了最低标准,但它故意避免过于规范,允许 AI 行业随着技术的发展而不断适应。通过促进透明度,该框架寻求为 AI 开发人员建立清晰的问责制,帮助政策制定者和公众区分该领域负责任的和不负责任的做法。这可以作为进一步监管的基础,如果需要的话,提供必要的证据和见解,以确定随着人工智能模型的发展是否需要额外的监督。

 

原文链接:

https://www.infoq.com/news/2025/07/anthropic-transparency-framework/

2025-07-30 12:003789

评论

发布
暂无评论

从Oracle日志解析学习数据库内核原理

沃趣科技

oracle 数据库内核

详解SQL操作的窗口函数

华为云开发者联盟

sql 窗口函数 AP场景

揭秘亚马逊云科技软件开发工程师团队

亚马逊云科技 (Amazon Web Services)

软件开发 工程师

怎么用netty开发一个同时提供http和websocket的服务?

风斩断晚霞

Java spring Netty springboot websocket

【技术干货】代码示例:使用 Apache Flink 连接 TDengine

TDengine

数据库 tdengine

ETH合并在即,这次升级将带来哪些机遇?

区块链前沿News

以太坊 eth Hoo

元宇宙用户已准备就绪,但技术瓶颈仍制约其真正“落地”

CECBC

大数据ETL自动化调度运维专家-TASKCTL

敏捷调度TASKCTL

Docker 大数据 程序员 DevOps 数据仓库

【智人智语】史赛克全球数字化、机器人及赋能技术总裁柯若博:世界智能大会是一个非常重要的盛会

InfoQ 天津

谁需要实验室内部管理系统?

低代码小观

实验室管理系统 数据管理系统 LIMS实验室信息管理系统 企业管理工具 检查系统服务

如何实现24/7客户服务自动化?建设智能客服知识库

小炮

【LeetCode】单词距离Java题解

Albert

LeetCode 5月月更

4种Springboot RestTemplate 服务里发送HTTP请求用法

华为云开发者联盟

Java Rest HTTP

带你学习MindSpore中算子使用方法

华为云开发者联盟

模型 mindspore 算子

HashSet源码分析-基础结构

zarmnosaj

5月月更

浪潮云应用质效管理系统(AOM)荣获2022数博会领先科技成果“优秀项目”奖

云计算

面向服务的架构

力软低代码开发平台

虚拟化解决方案 virtio 的技术趋势与 DPU 实践解读 | 龙蜥技术

OpenAnolis小助手

虚拟化 技术分享 DPU 龙蜥大讲堂 云豹智能

元宇宙的十大经济规则

CECBC

MASA Auth - SSO与Identity设计

MASA技术团队

C# .net 设计 构架 Auth

加码布局版式文档垂直赛道,福昕船舶图纸管理系统重磅发布

联营汇聚

技术分享 | Javaer 如何做单元测试?

LigaAI

Java 单元测试 LigaAI

【云堡垒机】云堡垒机很贵吗?怎么收费?

行云管家

网络安全 数据安全 堡垒机 云堡垒机

周六晚8点,如何基于 eBPF 技术构建应用可观测平台?

OpenAnolis小助手

Linux 直播 内核 龙蜥社区 sig

AI简报-增强版GAN图像超分:ESRGAN

AIWeker

人工智能 深度学习 5月月更 AI简报

【等保】等保测评中双因素认证是什么意思?等于双因子认证吗?

行云管家

网络安全 等保 双因子认证 等级保护

一键式打造DAO,M-DAO或成Web3新宠儿

西柚子

打造会“找”主人的麦克风,腾讯个性化语音增强技术荣获2022数博会领先科技成果奖

科技热闻

免费领 CRMEB 移动社交电商系统源码与授权

CRMEB

低碳数据中心建设思路及未来趋势

H3C-Navigator

图解|高性能服务器设计之缓存系统一致性

C++后台开发

redis 后端开发 Linux服务器开发 高性能服务器 系统缓存

Anthropic提出透明度框架以保障前沿AI发展_管理/文化_InfoQ精选文章