写点什么

从大脑视觉皮层获得灵感,初创公司 Vicarious 利用 AI 破解了 CAPTCHA 的安全性

  • 2017-11-19
  • 本文字数:1102 字

    阅读完需:约 4 分钟

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA 的挑战

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了 CAPTCHA 以区分人类和机器。在 2013 年,Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的 CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的 300 分之一。

为此,他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN 带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个 RCN,并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN 能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了 CAPTCHA 的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA,他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-19 18:002376
用户头像

发布了 199 篇内容, 共 91.3 次阅读, 收获喜欢 295 次。

关注

评论

发布
暂无评论
发现更多内容

都说区块链可信,到底信了个啥?

亨利笔记

区块链

手写一个持久化的Flutter会话管理器

岛上码农

flutter ios 安卓开发 跨平台开发 5月月更

DevOps系列之 —— DevOps概览(三)DevCloud HE2E DevOps 框架及其主要服务

若尘

DevOps 5月月更

26岁到来之际,我在阿里实现了年薪40W+的小目标

Java架构追梦

Java 后端开发 程序员面试

虎符交易所Hoo研究院|音乐NFT的路径在哪

区块链前沿News

NFT 虎符 Hoo 虎符交易所

jackson学习之二:jackson-core

爱好编程进阶

Java 程序员 后端开发

网站开发进阶(十)页面嵌套

No Silver Bullet

jsp iframe 5月月更 页面嵌套 include

励志!一年时间,从小白到进入阿里核心部门,“他”的逆袭之路

Java架构追梦

Java 后端开发 程序员面试

Redis+Nginx+设计模式+Spring全家桶+Dubbo阿里P8技术精选文档

Java架构追梦

Java 阿里 后端开发

架构实战营模块三作业

哈啰–J

拿了阿里、腾讯的offer的大佬给想进互联网大厂的程序员一个忠告

Java架构追梦

Java 阿里 程序员面试

Hive-0

爱好编程进阶

Java 程序员 后端开发

hive学习笔记之四:分区表

爱好编程进阶

Java 程序员 后端开发

Java 1045 快速排序

爱好编程进阶

Java 程序员 后端开发

电阻电路的等效变换 (Ⅲ)

謓泽

5月月更

DDD洋葱架构才是 yyds!阿里大牛手记(DDD)领域驱动设计应对之道

Java架构追梦

Java 架构师

吃透这份Github点赞120k的Spring全家桶笔记Offer拿到手软

Java架构追梦

Java 程序员 后端开发

不可谓不“细”!阿里内部价值百万“微服务架构精髓”限时开源

Java架构追梦

Java 微服务 后端开发

Java 1027 打印沙漏

爱好编程进阶

Java 程序员 后端开发

Git进阶系列 | 8. 用Reflog恢复丢失的提交

俞凡

git 最佳实践

架构、框架侃侃而谈算法望而却步?吃透这份笔记轻松掌握算法技能

Java架构追梦

Java 架构

WebAssembly技术_编译ffmpeg(ubuntu20.04)

DS小龙哥

5月月更

java List、Object、String

爱好编程进阶

Java 程序员 后端开发

Git进阶系列 | 7. Git中的Cherry-pick提交

俞凡

git

网站开发进阶 (十一) 知识汇总

No Silver Bullet

二维码 标签 5月月更 打印 元素隐藏

Android音视频——相关概念

程思扬

音视频 音视频开发

Harbor v2.5远程复制:制品的签名如影随形

亨利笔记

撸了一个Spring Boot + VUE 框架开发的分布式网盘系统「源码开源」

Java架构追梦

spring java面试 后端开发

HTTP 协议入门详解

爱好编程进阶

Java 程序员 后端开发

无聊科技正经事周刊(第5期):五一长假与虚拟旅行

潘大壮

程序员 周刊 科技 行业趋势 科技周刊

Android音视频——基础介绍

程思扬

音视频

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章