“AI 技术+人才”如何成为企业增长新引擎?戳此了解>>> 了解详情
写点什么

从大脑视觉皮层获得灵感,初创公司 Vicarious 利用 AI 破解了 CAPTCHA 的安全性

  • 2017-11-19
  • 本文字数:1102 字

    阅读完需:约 4 分钟

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA 的挑战

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了 CAPTCHA 以区分人类和机器。在 2013 年,Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的 CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的 300 分之一。

为此,他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN 带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个 RCN,并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN 能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了 CAPTCHA 的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA,他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2017-11-19 18:001711
用户头像

发布了 199 篇内容, 共 81.4 次阅读, 收获喜欢 293 次。

关注

评论

发布
暂无评论
发现更多内容

从抖音API看电商行业的未来趋势

技术冰糖葫芦

API

【第七在线】打破传统束缚:智能商品计划助力服装企业创新发展

第七在线

倒计时1天|解锁「PolarDB开发者大会」正确打开方式

阿里云瑶池数据库

数据库 阿里云 云计算, 开发者大会

【技术分享】RK356X Debian/Ubuntu系统安装Docker教程

百度搜索:蓝易云

Docker Linux ubuntu Debian RK356X

WBTT:“Fair Launch”如何做到更加公平

加密眼界

站在AGI拐点,重新想象老年生活

脑极体

AI

Go 简单设计和实现可扩展、高性能的泛型本地缓存

陈明勇

Go golang 缓存 go 本地缓存

用原型实现Class的各项语法

快乐非自愿限量之名

Java class 开发语言

一文介绍VR虚拟现实汽车展厅看车体验

3DCAT实时渲染

VR虚拟现实 汽车虚拟仿真 汽车VR展厅

从0到1:实验室设备借用小程序开发笔记

CC同学

WBTT:“Fair Launch”如何做到更加公平

长安区块链

WBTT:“Fair Launch”如何做到更加公平

大瞿科技

WBTT:“Fair Launch”如何做到更加公平

EOSdreamer111

外贸网站建站:如何选择合适的外贸网站设计方案

九凌网络

用 25,000 颗星撬动一个向量数据库的世界

Zilliz

Milvus Zilliz AIGC 向量数据库

左耳听风 - 高效学习「读书打卡 day 08」

Java 工程师蔡姬

学习 读书笔记 程序员 个人成长 职业发展

一文解析 Copycat Dex与 Bitcat Dex的区别

股市老人

WBTT:“Fair Launch”如何做到更加公平

BlockChain先知

泛微与用友NCC的无缝对接,释放企业运营潜能!

聚道云软件连接器

案例分享

抖音获取抖音视频详情 API (douyin.item_get_video)

技术冰糖葫芦

API

社媒引流对跨境电商的重要性

Ogcloud

云手机 海外云手机 跨境电商云手机

低代码开发应用解锁旅游业的创新潜力

不在线第一只蜗牛

低代码 低代码开发 旅游业

云计算与低代码开发:提升软件开发效率的完美组合

快乐非自愿限量之名

云计算 低代码

WBTT:“Fair Launch”如何做到更加公平

石头财经

笔记软件Notability新手使用教程:功能特点、替代软件盘点和分屏技巧!

彭宏豪95

ipad 在线白板 笔记软件 Notability boardmix

Docker安装RabbitMQ docker安装RabbitMQ完整详细教程

百度搜索:蓝易云

Docker Linux 运维 RabbitMQ 云服务器

软件测试|探索Flask接口路由技术:构建灵活可拓展的Python应用

霍格沃兹测试开发学社

AZ逃生:容灾部署最佳实践

焦振清

服务部署 弹性伸缩 机房容灾 AZ 逃生 同城多活

都是 Copycat Dex的通证,eCAT 和 CAT 这两有啥区别?

股市老人

WBTT:“Fair Launch”如何做到更加公平

股市老人

C# 介绍、应用领域、入门、语法、输出和注释详解

小万哥

C# 程序人生 编程语言 软件工程 后端开发

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章