在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

unCaptcha:准确率高达 85% 的谷歌语音验证码破解工具

  • 2017-11-01
  • 本文字数:1043 字

    阅读完需:约 3 分钟

很多网站使用谷歌的验证码系统 reCaptcha 来防止用户使用机器人进行自动操作,比如使用机器人创建账号等。2012 年,一个谷歌研究团队几乎百分百破解了其文本验证码系统。于是,谷歌将验证码升级到了语音和图像,并通过不断迭代加固他们的验证码系统。如果能够找到验证码系统的漏洞,也就等于把千万个网站暴露于攻击之下。

近日,美国马里兰大学的四位研究人员开源了一个叫作 unCaptcha 的工具,用于破解谷歌的语音验证码系统,准确率高达 85%。

谷歌的 reCaptcha 系统使用了一些高级的分析工具来判断一个用户到底是人还是机器人。他们使用了多种元素,包括 cookie、解题的速度、鼠标的移动以及解题的成功率。

unCaptcha 使用浏览器自动化工具(如 Selenium)找到网页上的语音验证码,解析出其中的数字,然后通过程序自动键入验证码,以此来骗过验证码系统。

语音验证码由一组变长的数字读音组成,每个数字的语速、音高也不一样,甚至口音也不一样。为了解析出这些数字,需要先从网页上把语音文件下载下来,然后将解析出来的语音元素发给在线的语音识别服务(比如 IBM、谷歌云、谷歌语音识别、Sphinx、Wit-AI、微软 Bing 语音识别)进行识别。识别之后的结果会被收集起来,组成一串数字,这些数字会自动键入到验证码的输入框,从而通过验证。

unCaptcha 已经在著名的 Reddit 网站上做过实验,并通过了谷歌的语音验证码系统,但为了不影响 Reddit 网站,他们在创建新用户这一步停止了实验。unCaptcha 在识别数字方面的准确率高达 92%,整体语音识别准确率达到了 85%。

该工具托管在 GitHub 上,并提供了安装使用示例。

另外,他们也发表了免责声明。他们开发 unCaptcha 的主要目的是作为概念性验证,而绝非要与谷歌作对。他们还将几个在线语音识别服务提供的 API 秘钥从项目中删除,避免不必要的麻烦。

Reddit 网站上有帖子针对该项目展开热议。有人对该项目所使用的技术手段赞不绝口。也有人开玩笑说,他们利用了第三方的在线语音识别服务,包括谷歌自家的语音识别系统,所以对于谷歌来说,无异于搬石头砸自己的脚。有人认为 85% 的准确率已经超过了他通过点击街景标志来输入验证码的正确率。也有人希望这个项目能够做成浏览器插件,这样就可以更轻松地绕过谷歌的验证码系统。

更多的信息可以参看 unCaptcha 网站 GitHub 项目主页,更多的 Reddit 讨论可以在这里看到。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-01 19:003738
用户头像

发布了 322 篇内容, 共 160.5 次阅读, 收获喜欢 148 次。

关注

评论

发布
暂无评论
发现更多内容

零基础学web前端,哪些培训机构比较好

小谷哥

chatGPT的爆火,是计算机行业这次真的“饱和”了?

千锋IT教育

KCL 与其他 Kubernetes 配置管理工具的异同 - Kustomize 篇 [一个自研编程语言能做什么?(系列 2)]

Peefy

开发者 工具 编程语言 Kubernetes Serverless #DevOps

零代码平台在政府智慧城市领域的应用

明道云

【从零开始学爬虫】采集收视率排行数据

前嗅大数据

大数据 数据采集 爬虫软件 爬虫教程 数据采集教程

从vivo的创新方法论中,读懂高端突破的“因果”

脑极体

AH协议

穿过生命散发芬芳

12月月更 AH协议

聊聊产品中的状态机设计

产品海豚湾

产品经理 产品设计 产品开发 需求分析 主业务流程梳理

明道云携手衡石科技共建企业应用数据分析联合解决方案

明道云

5分钟带你彻底掌握async底层实现原理!

千锋IT教育

通过WSL2运行GUI程序

吴脑的键客

WSL2 GUI

细说react源码中的合成事件

flyzz177

React

可视化:数据可视化发展史

Data 探险实验室

数据分析 可视化 数据可视化

低代码实现探索(五十四)低代码的描述文本

零道云-混合式低代码平台

React Context源码是怎么实现的呢

flyzz177

React

深入react源码看setState究竟做了什么?

flyzz177

React

专科非科班怎么选择培训机构

小谷哥

学习大数据该怎么选择培训机构?

小谷哥

北京哪家web前端开发机构比较好?

小谷哥

明道云联合契约锁共建人事场景电子签约解决方案

明道云

Linux RT 进程引发内核频繁卡死的优化方案

火山引擎边缘云

云计算 Linux 云原生 边缘计算 火山引擎边缘计算

java软件培训班毕业后找工作吗

小谷哥

openEuler 倡议建立 eBPF 软件发布标准

openEuler

开源 云原生 操作系统 内核 ebpf

架构实战 - 模块3作业

mm

学生管理系统架构 #架构实战营

2022全球边缘计算大会,火山引擎荣获“优质边缘云服务提供商”称号

火山引擎边缘云

云原生 CDN 边缘计算 边云协同 火山引擎边缘计算

React源码分析1-jsx转换及React.createElement

flyzz177

React

React源码分析(二)渲染机制

flyzz177

React

2022-12-15:寻找用户推荐人。写一个查询语句,返回一个客户列表,列表中客户的推荐人的编号都 不是 2。 对于示例数据,结果为: +------+ | name | +------+ | Wil

福大大架构师每日一题

数据库· 福大大

2022年的各大平台小游戏生态发展到哪一步了?

FN0

游戏开发 小游戏开发 小程序游戏开发

极客时间运维进阶训练营第八周作业

9527

React源码分析(三):useState,useReducer

flyzz177

React

unCaptcha:准确率高达85%的谷歌语音验证码破解工具_语言 & 开发_薛命灯_InfoQ精选文章