写点什么

蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0 ”,可实现用生成式能力检测生成式模型

  • 2023-07-07
    北京
  • 本文字数:1604 字

    阅读完需:约 5 分钟

蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0 ”,可实现用生成式能力检测生成式模型

7 月 7 日,2023 世界人工智能大会( WAIC )“聚焦·大模型时代 AIGC 新浪潮—可信 AI ”论坛举行,蚂蚁集团联合清华大学发布 AI 安全检测平台“蚁鉴 2.0 ”。蚁鉴 2.0 可实现用生成式 AI 能力检测生成式 AI 模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型 AI 安全检测平台。据了解,该产品还入选了本届大会的“镇馆之宝”。


蚂蚁集团联合清华大学共同发布 AI 安全检测平台“蚁鉴 2.0 ”


AIGC 安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰发表《可信人工智能展望》主题演讲。他认为,“不能再将人工智能视为简单的技术工作,而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”

 

在该论坛上,蚂蚁集团同时宣布,“蚁鉴 2.0 ”全面开放,面向全球开发者免费提供 AIGC 安全性、AI 可解释性、AI 鲁棒性三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

 

据了解,“蚁鉴 2.0 ”的两项硬核能力,一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类,可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测,并会生成检测报告,帮助大模型更加有针对性地持续优化。


蚂蚁集团大安全事业群技术部总裁李俊奎表示,“生成式大模型是一种‘深黑盒’技术,‘蚁鉴 2.0 ’通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,可实现「生成式机器人」对「AIGC 生成式模型」的诱导式检测计算,很像一个 24 小时不眠不休的‘安全黑客’在找茬大模型,从而找到大模型存在的弱点和安全问题所在。这种 AI 对 AI 的评测,也是教学相长。好比生成式考官考核生成式运动员,在对抗中双方能力互相提升,进一步提高整个行业的 AI 安全水位。”

 

另一项硬核能力是,“蚁鉴 2.0 ”融入了可解释性检测工具。综合 AI 技术和专家先验知识,通过可视化、逻辑推理、因果推断等技术,从完整性、准确性、稳定性等 7 个维度及 20 余项评估指标,对 AI 系统的解释质量量化分析,帮助用户更清晰验证与优化可解释方案。

 

据了解,“蚁鉴 2.0 ”集成了蚂蚁近 10 年可信 AI 实践、1000 余项可信 AI 专利,支持零编码测评。开发者通过 API 接口,将 AI 模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

 

蚂蚁集团认为,人工智能的深度应用,不仅对数据、算法、算力提出了更高要求,也对安全、隐私、伦理提出更多挑战。在确保数据安全和隐私保护、健全人工智能伦理与安全的前提下,才能让 AI 技术真正地释放应用价值。

 

此次论坛上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《 AIGC 可信倡议》。该倡议得到数十家单位参与,围绕人工智能可能引发的经济、安全、隐私和数据治理等问题,提出构建 AIGC 可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升 AIGC 可信工程化能力,最大限度确保生成式 AI 安全、透明、可释。


在 2023 WAIC 可信 AI 论坛上,“产学研用”界共同发起 AIGC 可信倡议


论坛现场还发布了由中国信通院、清华大学、蚂蚁集团联合编纂的《可信 AI 技术和应用进展白皮书( 2023 )》。该报告基于统一的可信 AI 认知维度,梳理总结可信 AI 发展现状,提练了面向新阶段大模型和 AIGC 引发的新需求,形成以技术为保障的可信 AI 评估体系和工具,探索新一代可信人工智能发展。

 

公开资料显示,蚂蚁从 2015 年开启可信 AI 的实践和探索,是蚂蚁集团在人工智能领域的重点布局之一。通过可信 AI 技术的突破,蚂蚁集团建设了一套世界领先的智能风控解决方案;蚁鉴 AI 安全检测平台先后获得 2022 年上海金融科技中心建设三周年优秀成果、信通院可信人工智能实践标杆案例等认可。


2023-07-07 16:397260
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 364 篇内容, 共 280.9 次阅读, 收获喜欢 298 次。

关注

评论

发布
暂无评论
发现更多内容

程序员面试太卷?我选择背这份阿里最新Java面试八股文(详解版)

小柴说Java

Java 编程 程序员 架构 面试

从 Kubernetes 事件中提取价值

玄月九

Kubernetes k8s Event 价值 事件

校招失败,在小公司熬了 2 年后我终于进了阿里,竭尽全力(Java 岗)

退休的汤姆

面经 社招 面试技巧 Java工程师 秋招

仿淘宝大流量高并发电商领域核心项目已上线(完整流程+白皮书)

小柴说Java

Java 编程 程序员 架构 面试

信用卡业务数字化专题研究2022H1

易观分析

金融 信用卡

我凭借这份pdf成功拿到了蚂蚁,京东,小米,腾讯等大厂的offer

小柴说Java

Java 编程 程序员 架构 面试

无意中发现阿里巴巴Java开发手册「2022最新黄山版」竟然发布了

Java面试那些事儿

Java 编程 程序员 架构 面试

Spring Security OAuth2客户端凭据授权

程序知音

Java 程序员 springboot 后端技术

今天才晓得跟月薪5W的聊过后,才知道自己一直在打杂...

退休的汤姆

Java 面经 社招 Java工程师 秋招

外包干了四年,感觉人生就这样了..

退休的汤姆

Java 面经 社招 Java工程师 秋招

秋招偷偷盘点一下各大互联网公司的实习薪资

退休的汤姆

面经 大厂面试 社招 Java工程师 秋招

连续仨月霸占牛客榜首!京东T8呕心巨作:700页JVM虚拟机实战手册

小柴说Java

Java 编程 程序员 架构 面试

首次公开!阿里巴巴最新高并发架构设计实录被我从Github扒下来了

程序员小毕

Java 程序员 架构 面试 高并发

双非本科参加了数场面试,并从美团三面中总结出Java面试真题手册

Java面试那些事儿

Java 编程 程序员 架构 面试

RabbitMQ面试29连问,看完还过不了面试,我给你一Jio

小柴说Java

Java 编程 程序员 架构 面试

你必须知道的Java泛型

自然

Java core 8月月更

冲刺金九银十!GitHub中文社区秋招趋势最热的面试题被我整理好了

Java面试那些事儿

Java 编程 程序员 架构 面试

秋招!2022备战金九银十Java面试八股文合集 高薪的敲门砖

退休的汤姆

Java、 面经 社招 Java工程师 秋招

秋招腾讯!配套初级程序员到Java高级架构师学习路线+配套学习资源

退休的汤姆

Java、 面经 社招 Java工程师 秋招

他97年的,我既然卷不过他...

退休的汤姆

Java 外包 面经 Java工程师 秋招

什么是架构思维?

涛哥 数字产品和业务架构

企业架构

惊爆GitHub!腾讯T14级SQL首席专家开源分布式数据库架构实践手册

小柴说Java

Java 编程 程序员 架构 面试

秋招最牛的Java面试八股文合集,让我见识到了基础的天花板

退休的汤姆

Java、 面经 社招 Java工程师 秋招

袭卷面试大厂!秋招最全Java面试八股文,堪称大厂offer收割机!

退休的汤姆

Java、 面经 社招 Java工程师 秋招

Github 秋招爆火!这套面试笔记足够你拿下 90% 以上的 Java 面试!

退休的汤姆

Java、 面经 社招 Java工程师 秋招

用户权限-Linux系统基本权限

Albert Edison

Linux centos 运维 用户权限 8月月更

架构师知识的可迁移性:目标,元素,连接

田晓亮

架构

基于小程序的小区物业管理平台开发笔记

CC同学

计算机网络(五、运输层)

计算机网络 8月月更

计算机网络(六、应用层)

计算机网络 8月月更

蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0 ”,可实现用生成式能力检测生成式模型_阿里巴巴_鲁冬雪_InfoQ精选文章