Anthropic提出透明度框架以保障前沿AI发展_管理/文化_InfoQ精选文章

50万奖金+官方证书，深圳国际金融科技大赛正式启动，点击报名了解详情 



 写点什么

登录/注册



大小：550.38K时长：03:07

Anthropic提出透明度框架以保障前沿AI发展

Anthropic 提出了一个新的透明度框架，旨在解决在前沿 AI 模型开发过程中日益增长的问责需求。这一提议的重点针对正在开发强大 AI 模型的大型人工智能公司，这些公司是以计算能力、成本、评估性能和年度研发支出等因素来区分的。目标是建立一套标准，以确保安全，降低风险，并提高公众对这些先进 AI 系统的开发和部署的可见度。

框架的一个核心方面是实施安全开发框架（Secure Development Frameworks，SDFs），这将要求大型 AI 公司评估和减轻与其模型相关的潜在灾难性风险。这些风险包括化学的、生物的及放射性的危害，以及由模型自主性错位造成的伤害。该提案概述了这些框架不仅应解决风险缓解问题，还应确保负责任地处理 AI 开发流程。

该框架的一个关键要求是公开披露。根据提议的法规，AI 公司将被要求通过注册网站公开其SDFs，提供对其安全实践的透明度。这将允许研究人员、政府和公众获取有关部署模型的重要信息，确保安全标准得到满足，并妥善管理任何风险。此外，公司还需要发布系统卡片，提供模型测试程序、评估结果和实施的缓解措施的摘要。每当模型被修订或添加新功能时，这些文件都需要更新。

该框架还建议小型开发人员和初创公司不受这些要求的限制。相反，这些法规将适用于有潜力造成重大伤害的大规模 AI 公司，例如那些拥有大量计算能力或财务资源的公司。豁免旨在避免给小型公司带来不当负担，同时仍将监管工作集中在该领域最大的参与者身上。

此外，提议包括执行合规的具体条款。如果 AI 公司就其遵守框架的情况提供虚假或误导性陈述，将构成违法行为，确保必要时可以应用举报人保护。执法机制将允许司法部长对违规行为追究民事处罚，帮助维护系统的完整性。

社区的反应反映了对最近全球关于 AI 监管讨论的乐观、怀疑和实际关切的担忧。

AI 专家Himanshu Kumar在 X 上发表评论：

促进开源 AI 开发对安全创新不也是至关重要的吗？

与此同时，用户Skeptical Observer也发表了评论：

由谁来执行？这感觉非常以美国为中心。中国的实验室或其他范围之外的呢？举报人保护听起来不错，但没有全球覆盖，这只是权宜之计。希望他们在 AI 安全峰会上澄清这一点！

最终，提议的透明度框架旨在在确保AI安全和促进持续创新之间取得平衡。虽然框架为透明度设定了最低标准，但它故意避免过于规范，允许 AI 行业随着技术的发展而不断适应。通过促进透明度，该框架寻求为 AI 开发人员建立清晰的问责制，帮助政策制定者和公众区分该领域负责任的和不负责任的做法。这可以作为进一步监管的基础，如果需要的话，提供必要的证据和见解，以确定随着人工智能模型的发展是否需要额外的监督。

原文链接：

https://www.infoq.com/news/2025/07/anthropic-transparency-framework/

评论

发布

暂无评论

从Oracle日志解析学习数据库内核原理

oracle 数据库内核

详解SQL操作的窗口函数

华为云开发者联盟

sql 窗口函数 AP场景

揭秘亚马逊云科技软件开发工程师团队

亚马逊云科技 (Amazon Web Services）

软件开发工程师

怎么用netty开发一个同时提供http和websocket的服务？

风斩断晚霞

Java spring Netty springboot websocket

【技术干货】代码示例：使用 Apache Flink 连接 TDengine

数据库 tdengine

ETH合并在即，这次升级将带来哪些机遇？

区块链前沿News

以太坊 eth Hoo

元宇宙用户已准备就绪，但技术瓶颈仍制约其真正“落地”

大数据ETL自动化调度运维专家-TASKCTL

敏捷调度TASKCTL

Docker 大数据程序员 DevOps 数据仓库

【智人智语】史赛克全球数字化、机器人及赋能技术总裁柯若博：世界智能大会是一个非常重要的盛会

谁需要实验室内部管理系统？

低代码小观

实验室管理系统数据管理系统 LIMS实验室信息管理系统企业管理工具检查系统服务

如何实现24/7客户服务自动化？建设智能客服知识库

【LeetCode】单词距离Java题解

LeetCode 5月月更

4种Springboot RestTemplate 服务里发送HTTP请求用法

华为云开发者联盟

带你学习MindSpore中算子使用方法

华为云开发者联盟

模型 mindspore 算子

HashSet源码分析-基础结构

浪潮云应用质效管理系统（AOM）荣获2022数博会领先科技成果“优秀项目”奖

面向服务的架构

力软低代码开发平台

虚拟化解决方案 virtio 的技术趋势与 DPU 实践解读 | 龙蜥技术

OpenAnolis小助手

虚拟化技术分享 DPU 龙蜥大讲堂云豹智能

元宇宙的十大经济规则

MASA Auth - SSO与Identity设计

MASA技术团队

C# .net 设计构架 Auth

加码布局版式文档垂直赛道，福昕船舶图纸管理系统重磅发布

技术分享 | Javaer 如何做单元测试？

Java 单元测试 LigaAI

【云堡垒机】云堡垒机很贵吗？怎么收费？

网络安全数据安全堡垒机云堡垒机

周六晚8点，如何基于 eBPF 技术构建应用可观测平台？

OpenAnolis小助手

Linux 直播内核龙蜥社区 sig

AI简报-增强版GAN图像超分：ESRGAN

人工智能深度学习 5月月更 AI简报

【等保】等保测评中双因素认证是什么意思？等于双因子认证吗？

网络安全等保双因子认证等级保护

一键式打造DAO，M-DAO或成Web3新宠儿

打造会“找”主人的麦克风，腾讯个性化语音增强技术荣获2022数博会领先科技成果奖

免费领 CRMEB 移动社交电商系统源码与授权

低碳数据中心建设思路及未来趋势

图解|高性能服务器设计之缓存系统一致性

C++后台开发

redis 后端开发 Linux服务器开发高性能服务器系统缓存