在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

从大脑视觉皮层获得灵感,初创公司 Vicarious 利用 AI 破解了 CAPTCHA 的安全性

  • 2017-11-19
  • 本文字数:1102 字

    阅读完需:约 4 分钟

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA 的挑战

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了 CAPTCHA 以区分人类和机器。在 2013 年,Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的 CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的 300 分之一。

为此,他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN 带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个 RCN,并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN 能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了 CAPTCHA 的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA,他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-19 18:002574
用户头像

发布了 199 篇内容, 共 95.0 次阅读, 收获喜欢 295 次。

关注

评论

发布
暂无评论
发现更多内容

智慧路灯杆三维可视化管理系统

2D3D前端可视化开发

物联网 智慧城市 智慧路灯 智慧灯杆 智慧路灯杆

第二届石家庄“海石杯”高层次人才创新创业大赛(西安、北京赛区)

科兴未来News

石家庄 双创比赛

四川省信创联盟2023年第一次理事会顺利召开,MIAOYUN荣获“信创企业优秀奖”!

MIAOYUN

信创 信创云 金融信创 信创产业 信创生态

MobTech MobPush|ChatGPT辅助消息推送,实现文案千人千版

MobTech袤博科技

开源赋能 普惠未来|OpenNJet诚邀您参与2023开放原子全球开源峰会

开放原子开源基金会

BSN-DDC基础网络详解(十二):算力中心开发者门户部署说明(1)

BSN研习社

利用 DynamoDB 和 S3 结合 gzip 压缩,最大化存储玩家数据

亚马逊云科技 (Amazon Web Services)

存储

名侦探白洞(一):智能家居灵异事件

白洞计划

AI

2023开放原子全球开源峰会分论坛即将来袭,Pick你最关注的峰会话题!

开放原子开源基金会

共话开源,为热爱而聚!2023开放原子全球开源峰会“开发者之夜”节目征集进行中!

开放原子开源基金会

开源

从“0”到“1”!低代码开发和云计算的碰撞,引领数字化转型浪潮!

加入高科技仿生人

云计算 低代码 数字化 数智化

AIGC持续火爆大模型争相推出,庞大市场造就算力供应模式演变

王吉伟频道

nvidia 算力 AI大模型 AIGC 生成式AI

构建系列之webpack窥探下

江湖修行

前端 Web webpack cli

Last Week in Milvus

Zilliz

扩展可能性:发挥React Native与小程序集成的优势

FinFish

React Native 跨端开发 小程序容器 跨端框架 小程序技术

数字化转型应该如何去做?(方法篇)

数字随行

数字化转型

开源赋能 普惠未来|QUICKPOOL诚邀您参与2023开放原子全球开源峰会

开放原子开源基金会

开源

2023-05-22:给定一个长度为 n 的字符串 s ,其中 s[i] 是: D 意味着减少; I 意味着增加。 有效排列 是对有 n + 1 个在 [0, n] 范围内的整数的一个排列 perm

福大大架构师每日一题

Go 算法 rust 福大大

中移链合约常用开发介绍(五)合约项目编译

BSN研习社

可以免费使用的ChatGPT-4,微软开放Bing Chat功能,供用户体验

炜娓道来程序人生

AI AIGC ChatGPT

inBuilder今日分享丨智能化开发的现状与未来

inBuilder低代码平台

火山引擎DataLeap数据调度实例的 DAG 优化方案(三):技术实现

字节跳动数据平台

大数据平台 数据检索 DataLeap

关于大型语言模型的争论和局限

OneFlow

自然语言处理 AI大语言模型

软件测试/测试开发丨Python学习笔记-继承与多态

测试人

Python 软件测试 自动化测试 测试开发

【腾讯云 Finops Crane 集训营】安装使用及EHPA弹性演示

指剑

腾讯云 Kubernetes 降本增效 FinOps crane

Transformer模型的基础演算

OneFlow

人工智能 AI

企业敏捷开发的三种落地实践途径

力软低代码开发平台

打卡智能中国(五):博士都去哪儿了?

脑极体

AI 智能中国

即时通讯(IM)开源项目OpenIM对WebAssembly支持,提升web端体验

Geek_1ef48b

@广州 智在粤港澳,Serverless 为创新提速

阿里巴巴云原生

阿里云 Serverless 云原生

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章