从大脑视觉皮层获得灵感，初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章

AICon 北京站 Keynote 亮点揭秘，想了解 Agent 智能体来就对了！了解详情 



 写点什么

登录/注册

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术，从而有能力解决CAPTCHA 的挑战。

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说，在不同的环境下检测出字母是件困难的事。出于这个原因，发明了 CAPTCHA 以区分人类和机器。在 2013 年，Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今，他们改进了算法，所需的数据变得更少以推广到所有的 CAPTCHA。通常，神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是，他们的新系统归纳能力更好，训练所需的数据只是原来的 300 分之一。

为此，他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反，RCN 带着与轮廓和表面相关的知识开始学习。这种预备知识有利于模型的建立和推广，而一般的神经网络必须学习已存在着的轮廓和表面，还必须学习物体和背景之间的不同。多亏了预备知识，现在可以在几个独立的物体上训练一个 RCN，并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时，神经皮层就已经有能力区分前景和背景。对于我们来说，比起从一片空白开始学习所有的东西，在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来，RCN 能够识别具有不同外观的物体，无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到，如果在训练了两个网络之后，修改了 CAPTCHA 的表达，那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后，表现却更好。

为了生成训练和测试数据，研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA，他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳，就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》及其网站上。

查看英文原文： Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex

感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们。

评论

发布

暂无评论

沉浸式视听体验：全景声技术是如何实现的？

阿里云CloudImagine

阿里云音视频音频

关于DAO社区代币挖矿治理dapp系统开发

开发微hkkf5566

桌面端运行小程序的简易实操

跨端开发跨端运行桌面应用桌面应用开发

大专参加大数据培训学习要具备哪几方面的知识

手把手在桌面应用中运行小程序

小程序 windows Mac 软件

DAO社区治理代币投票挖矿系统开发合约定制

开发微hkkf5566

技术内幕 | StarRocks 支持 Apache Hudi 原理解析

前端安全问题及防护思路

网络安全安全安全架构移动安全前端安全

新双机热备软件排名看这里！

高可用双机热备

先楫半导体HPM6700系列正式合入OpenHarmony社区主干

JavaScript刷LeetCode-字符串类解题技巧

JavaScript LeetCode

Java培训机构应该怎么去学习开发技术

params传参与body传参区别

软件开发前端开发后端开发小程序开发

软件测试面试真题 | UI自动化测试如何通过子元素定位父元素？

软件测试面试题自动化测试

前端培训学习需要哪些知识？

HarmonyOS线上Codelabs系列挑战赛第二期：调用三方库，制作酷炫的视觉效果

HarmonyOS开发者

JavaScript刷LeetCode心得

JavaScript LeetCode

堡垒机小知识科普-行云管家

网络安全信息安全堡垒机等保2.0

如何把 ThinkPHP 5 的项目迁移到阿里云函数计算来应对流量洪峰？

阿里巴巴云原生

阿里云 Serverless 云原生函数计算

设备接入物联网平台必知必会——设备接入类

阿里云数据物联网设备接入协议解析

JavaScript刷LeetCode拿offer-栈相关题目

JavaScript LeetCode

TDSQL携手金蝶云·苍穹，发布“国产数据库联合解决方案”

腾讯云数据库

数据库腾讯云 tdsql 金蝶腾讯云数据库

软件测试面试真题 | 测试一个你完全不熟悉的系统，你会怎么办？

软件测试面试题自动化测试测试开发

【电商实战02】如何借助工具快速生成代码？初学者容易踩的坑有哪些？

golang 高效工作学习方法程序员 11月月更

合阔智云核心生产系统切换到服务网格 ASM 的落地实践

阿里巴巴云原生

阿里云云原生服务网格

低代码技术在研发团队的应用模式探讨

阿里巴巴终端技术

前端终端低代码客户端

用javascript分类刷leetcode3.动态规划(图文视频讲解)

JavaScript LeetCode

零基础转行Web前端培训机构怎么选

使用 C++ 部署深度学习模型快速上手方案

c++ 深度学习开源 MegEngine 模型部署

【LeetCode】只出现一次的数字Java题解

算法 LeetCode 11月月更

【Go电商实战03】如何使用ORM链式操作?如何优雅的实现软删除？

Go golang 高效工作学习方法 11月月更