写点什么

从大脑视觉皮层获得灵感,初创公司 Vicarious 利用 AI 破解了 CAPTCHA 的安全性

  • 2017-11-19
  • 本文字数:1102 字

    阅读完需:约 4 分钟

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA 的挑战

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了 CAPTCHA 以区分人类和机器。在 2013 年,Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的 CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的 300 分之一。

为此,他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN 带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个 RCN,并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN 能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了 CAPTCHA 的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA,他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-19 18:002539
用户头像

发布了 199 篇内容, 共 94.3 次阅读, 收获喜欢 295 次。

关注

评论

发布
暂无评论
发现更多内容

Docker教程:如何将Helix QAC创建为一个容器并运行?

龙智—DevSecOps解决方案

Docker 容器 Helix QAC 静态代码扫描

浅析云原生时代的服务架构演进

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜

Atlassian后Server时代 | Server版vs.数据中心版,二者的区别在哪里?

龙智—DevSecOps解决方案

Atlassian 数据中心版 server版

SpringBoot整合RocketMQ,老鸟们都是这么玩

Java RocketMQ Spring Boot

玩转Github:三分钟教你如何用 Github 快速找到优秀的开源项目

程序知音

Java GitHub 编程语言 后端技术

成都开发者Meetup|聚焦云原生开源,点亮企业创新活力

阿里巴巴云原生

阿里云 容器 微服务 云原生

你的 Kubernetes 安全吗?最新benchmark的重要趋势解读

HummerCloud

Kubernetes k8s

“字节”再次起跳!内部651页剖析HotSpot 源码手册,GitHub已开源

Java JVM 虚拟机 hotspot

又搞事!阿里400页JDK并发源码指南,再次被GitHub置顶了!

Java jdk 多线程 高并发 源码剖析

文献管理软件:EndNote 20 v20.5激活版

真大的脸盆

Mac Mac 软件 文献管理 文献管理工具

OpenTiny 跨端、跨框架组件库升级TypeScript,10万行代码重获新生

华为云开发者联盟

Vue 前端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

【重磅发布】易观千帆用户体验分析产品领先版正式发布

易观分析

金融 银行 用户分析

企业云管平台是什么?有什么用?

行云管家

云计算 云管理 云管

从零学习SDK(4)使用SDK创建一个简单的应用程序

MobTech袤博科技

MySQL数据库和Redis缓存一致性的更新策略

Java MySQL 数据库 redis 缓存

低至200元/月,火山引擎DataLeap帮你搭建企业级数据中台

字节跳动数据平台

数据中台 数据集成 促销 数字化建设 企业号 4 月 PK 榜

扯下@EventListener这个注解的神秘面纱。

why技术

Java 源码

🔥InfoQ写作社区三周年主题征文火热开启

InfoQ写作社区官方

热门活动 三周年征文

LED显示屏十大应用领域值得你收藏

Dylan

LED显示屏 户外LED显示屏 户内led显示屏

大模型高效开发的秘密武器:大模型低参微调套件MindSpore PET

华为云开发者联盟

人工智能 华为云 大模型 华为云开发者联盟 企业号 4 月 PK 榜

火山引擎云原生数据仓库ByteHouse技术白皮书V1.0(上)

字节跳动数据平台

大数据 数据仓库 云原生 实时数仓 企业号 4 月 PK 榜

[直播预告]行云管家堡垒机V7.0版本说明会

行云管家

行云管家

什么是可信云?通过可信云评估意味着什么?

行云管家

可信云

简化你的代码,提高生产力:这10个Lambda表达式必须掌握

Java Lambda

用友开发者中心应用构建实践指引(二):如何实现入职申请单功能?

YonBuilder低代码开发平台

Gartner最新报告,分析超大规模边缘解决方案

阿里云CloudImagine

云计算 边缘计算 边缘云

从 OSPO 角度思考开源治理问题——蚂蚁集团开源办公室负责人边思康

开源雨林

雀氏牛,Alibaba分布式微服务成长手册,GitHub已开源

Java 分布式 微服务

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章