写点什么

从大脑视觉皮层获得灵感,初创公司 Vicarious 利用 AI 破解了 CAPTCHA 的安全性

  • 2017-11-19
  • 本文字数:1102 字

    阅读完需:约 4 分钟

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA 的挑战

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了 CAPTCHA 以区分人类和机器。在 2013 年,Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的 CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的 300 分之一。

为此,他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN 带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个 RCN,并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN 能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了 CAPTCHA 的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA,他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-19 18:002500
用户头像

发布了 199 篇内容, 共 93.6 次阅读, 收获喜欢 295 次。

关注

评论

发布
暂无评论
发现更多内容

每周总结(2月1日-2月7日)

Nydia

Web页面制作基础

我是哪吒

学习 程序员 面试 大前端 二月春节不断更

LeetCode题解:153. 寻找旋转排序数组中的最小值,二分查找,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

极客时间APP购买课程模块用例文档

夏天的风

用例图

产品0期 - 第四周作业 - 附件1

曾烧麦

产品训练营

什么是SNMP

面试官系列:讲几个分布式自增ID的方案?

后台技术汇

28天写作 2月春节不断更

架构的变迁,从分层架构先聊起

华为云开发者联盟

架构 软件 分层架构 架构师 系统

作业之用例

踏凌霄

MyBatis专栏 - 关联查询之一对一

小马哥

Java mybatis 七日更 二月春节不断更

4. 列表一学完,Python 会一半,滚雪球学 Python

梦想橡皮擦

python 爬虫 Python Monad 2月春节不断更

说说Golang goroutine并发那些事儿

华为云开发者联盟

线程 进程 并发 goroutines Go 语言

红信圈系统开发,红信圈APP开发

luluhulian

第四次作业

Geek_79e983

2021年人工智能数据采集标注行业四大趋势预测;清华提出深度对齐聚类用于新意图发现

京东科技开发者

人工智能 数字货币

【STM32】GPIO输入—按键检测

AXYZdong

硬件 stm32 2月春节不断更

京东科技集团21篇论文高票入选国际顶会AAAI 2021

京东科技开发者

机器学习 AI

交易所搭建

v16629866266

交易所开发

话题讨论 | 你选择去一线城市还是老家的省会城市?

石云升

话题讨论 职业发展 2月春节不断更

一个只会写Bug的Coder年终总结

z小赵

程序员 互联网 职场成长

自动驾驶“绝地求生”结束了,但深兰的造车故事才刚刚开始

脑极体

我的2020年学习总结

兆熊

学习 总结

有了这个算法,图像上文字擦除再也用不上PS了

华为云开发者联盟

深度学习 算法 GAN 文字擦除 图像

当自动驾驶遇到5G,会擦出怎样的火花?这篇文章说明白了

华为云开发者联盟

人工智能 自动驾驶 AI 5G

别困惑,不是你的错!90%的开发者把Clubhouse看成了Clickhouse

京东科技开发者

Clickhouse 社交 clubhouse

【新春特辑】发压岁钱、看贺岁片、AI写春联……华为云社区给大家拜年了

华为云开发者联盟

华为云

我认为的互联网医疗场景用户及场景

卢嘉敏

需求 医疗 用户

Vue开发中可以使用的ES6新特征

devpoint

Vue ES6

Elasticsearch Mapping

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

互联网医疗里,用户需要的是什么

卢嘉敏

需求 医疗 用户

WEEK4作业

Geek_6a8931

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章