写点什么

GitHub Copilot 加入基于 AI 的代码密码扫描功能

  • 2025-04-15
    北京
  • 本文字数:1175 字

    阅读完需:约 4 分钟

GitHub Copilot 加入基于 AI 的代码密码扫描功能

GitHub 在其 Copilot 功能中引入了一项基于 AI 的密码扫描功能,该功能已经整合到 GitHub Secret Protection 中。通过上下文分析,这一新功能显著提升了检测代码泄露密码的能力。与传统的正则表达式方法相比,这种方法可以识别多样化的密码结构,并减少误报数量。


GitHub 的一篇博文写道,该系统现在会分析潜在的密码使用和存储位置,以减少无关警报,并提供更准确的通知,这对保证代码库的安全来说至关重要。Sensis 高级软件工程师 Sorin Moga 在领英上评论称,这标志着平台安全进入了一个新时代,AI 不仅可以协助开发,还可以保障代码的完整性。


在这项功能的私密预览阶段,一个关键性挑战是其对非传统文件类型和结构的处理存在困难,这突显了仅依赖大语言模型初始训练数据的局限性。GitHub 最初采用的方法是利用 GPT-3.5-Turbo 的“少量样本提示”(few-shot prompting)技术,为模型提供示例来指导检测。


为了解决这些问题,GitHub 大幅增强了其离线评估框架,通过加入私有预览参与者的反馈来丰富测试用例,并利用 GitHub 代码安全团队的评估流程构建更强大的数据收集管道。他们甚至使用了 GPT-4,根据开源代码库中现有的密码扫描警报生成新的测试用例。这种改进的评估方法能够更好地衡量 精确率(降低误报)和 召回率(减少漏报)。


GitHub 尝试了多种技术来提高检测质量,包括尝试不同的 LLM 模型(例如将 GPT-4 作为验证扫描器)、重复提示(“投票”)和多样化的提示策略。最终,他们与微软合作,采用了微软的 MetaReflection 技术,这是一种离线强化学习形式,结合了思维链(Chain of Thought,CoT)和少量样本提示来提高准确率。


正如 GitHub 的博文所述:


我们最终决定采用这些技术的组合,并正式公开预览 Copilot 的密码扫描功能,向所有 GitHub Secret Protection 的用户全面开放。


为了进一步验证这些改进,并为全面推出做好准备,GitHub 实现了一个“镜像测试”框架。该框架涉及在公开预览的一个子集代码库上测试提示和过滤更改。通过使用最新的改进来重新扫描这些代码库,GitHub 可以在不影响用户的情况下评估对实际警报量和误报解决的影响。


测试结果表明,检测量和误报量均显著减少,对实际的密码发现影响微乎其微。在某些情况下,误报量甚至减少了 94%。博文总结道:


对比显示,在私有和公开预览阶段所做的所有修改都提升了精确度,而且没有降低召回率。我们已准备好为所有 GitHub Secret Protection 用户提供一个可靠且高效的密码检测机制。


Copilot 团队在开发过程中积累了宝贵的经验教训,包括重视准确性、根据用户反馈采用多样化的测试用例、有效管理资源以及促进团队合作。这些经验教训也被应用到了 Copilot Autofix 项目中。自全面推出以来,Copilot 的密码扫描功能已经成为安全配置的一部分,用户可以决定扫描哪些代码库。


查看英文原文

https://www.infoq.com/news/2025/03/github-ai-copilot-secretscanning/

2025-04-15 08:006120

评论

发布
暂无评论

专业国外社交媒体分析服务如何实现舆情溯源、影响评估与策略建议

沃观Wovision

社交媒体 海外社交媒体监控 社交媒体监测 社媒分析

基于 IPIDEA 的 SERP 结构化数据抽取与趋势监控的工程化实践

海拥(haiyong.site)

黑龙江等保测评中日常安全巡检的测评重点与注意事项

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

数据血缘(上):企业数据管理深陷 “黑盒”?数据血缘是破局关键!

数造万象

人工智能 数据 数据管理 数据血缘 #大数据

海外网红推广执行全流程:从策划到落地的完整操作指南

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

2026年出海企业必须知道的十个国外社交媒体分析网站

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社交媒体监测 社媒分析

Android动效探索:彻底弄清如何让你的视频更加酷炫

vivo互联网技术

android ffmpeg 跨平台 OpenGL ES MediaPlayer

强大的Bash自动化测试框架Bats-core

qife122

bash automation

2026年海外社交媒体分析服务商 TOP10

沃观Wovision

社交媒体 海外社交媒体监控 社媒分析

出海企业如何选择最好用的媒体分析工具?

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社媒分析

使用Playwright MCP实现UI自动化测试:从环境搭建到实战案例

测试人

SOLID原则在React中的应用实践

qife122

前端架构 React

用AI让藏品说话项目开发笔记

严学峰

AI编程 AI编程助手

突破创意瓶颈:社交媒体营销的“创意流水线”搭建指南

Wolink

跨境电商 海外社媒营销 海外营销推广 品牌出海 海外红人营销

SOLO 新增多任务列表:并行开发,效率翻倍

北京中暄互动广告传媒有限公司

详细指南:DNS缓存的作用、危害与清理方法全解析

防火墙后吃泡面

启信宝《2025全国采购地图》:藏在县城的“隐形冠军”,撑起你的购物车

合合技术团队

人工智能 大数据 算法

一文解析得物自建 Redis 最新技术演进

得物技术

redis Proxy 同城双活

黑龙江等保测评中攻防演练的测评重点与注意事项

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

黑龙江等保测评二级:材料与时间规定解析

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

SOLO Coder:从规划到执行,智能调度多智能体

北京中暄互动广告传媒有限公司

京东商品列表API:关键词搜索与多维度筛选

Datafox(数据狐)

京东API 京东商品列表API 京东数据采集 京东数据 关键词搜索京东列表接口

英特尔和生态伙伴联合发布双路冷板式全域液冷服务器

科技经济

《浙商》杂志|协作方能共赢,湘湖论剑网易专场对接会描绘AI人机共生新蓝图

网易伏羲

人机协作 网易伏羲 网易灵动 智能货柜 网易有灵智能体

京东API详解:如何获取商品标题、价格和库存

Datafox(数据狐)

京东API 京东商品详情API 京东数据采集

一键对比:主流国外社交媒体分析网站功能一览

沃观Wovision

社交媒体 社媒监测 海外社交媒体监控 社媒分析

吉大正元PKI终端安全中间件已适配鸿蒙,共筑安全可信的基础设施

新消费日报

数据说话,节能落地:MyEMS 开源系统,让能源消耗可视化、优化可执行

开源能源管理系统

开源 能源管理系统

大厂集体押注 SDD!阿里、腾讯、亚马逊都在用的规范驱动开发,优势在哪?坑怎么避?

莫尔索

codex AI编程 cursor kiro Claude Code

绥化等保测评:适用企业及核心侧重点解析

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

财务 RPA 实战指南:从功能剖析到厂商选型

Techinsight

GitHub Copilot 加入基于 AI 的代码密码扫描功能_AI&大模型_Steef-Jan Wiggers_InfoQ精选文章