【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

哈佛大学联合 MIT 研究人员发布了 Clevrer 数据集,以推进视觉推理和神经符号 AI 的发展

  • 2020-06-08
  • 本文字数:1705 字

    阅读完需:约 6 分钟

哈佛大学联合MIT研究人员发布了Clevrer数据集,以推进视觉推理和神经符号AI的发展

近日,哈佛大学和麻省理工学院沃森 AI 实验室的研究人员发布了 Clevrer 数据集,用于评估 AI 模型识别因果关系和进行推理的视频诊断数据集。麻省理工学院 IBM 沃森实验室负责人大卫·考克斯 (David Cox) 称, Clevrer 数据集可以在创造混合 AI 方面取得进展,混合 AI 是指结合了神经网络和符号 AI 的混合型 AI。IBM 研究团队负责人达里奥·吉尔 (Dario Gil) 亦将神经符号 AI 列为 2020 年最重要的进展之一。


Clevrer 是一个诊断视频数据集,用于系统评估各种推理任务上的计算模型。近期,在全数字化的国际表征学习会议 (ICLR) 上发表的一篇论文中,介绍了有关视频表征与推理 (Clevrer) 数据集碰撞事件的初步研究成果。


Clevrer 建立在 Clevr 基础之上。Clevr 是斯坦福大学 (Stanford University) 和 Facebook AI 研究团团队 (Facebook AI Research)于 2016 年发布的一组数据集,用来分析神经网络的视觉推理能力。该团队成员包括大名鼎鼎的 ImageNet 创始人李飞飞 (Fei Fei Li) 博士。在国际表征学习会议 (ICLR) 上,Clevrer 的共同创作者例如来自麻省理工学院-IBM 沃森实验室 (MIT-IBM Watson Lab) 的庄根和来自 Deepmind 的普希梅特·科利 (Pushmeet Kohli) 等人对神经符号概念 NS-DR (Neuro Symbolic Concept Learner,NS-DR),一种应用于 Clevr 的神经符号学模型做了介绍。


该论文写道:“我们对视频的时间和因果推理进行了系统性的研究。视频的时间和因果推理这个问题非常深刻且具有挑战性,它困扰研究人员很久了,但我们才刚刚开始用‘现代化的’ AI 工具来对它进行研究。”“我们新开发的 Clevrer 数据集和 NS-DR 模型即是朝这个研究方向进行的初步探索。”


Clevrer 数据集由 Bullet 物理模拟器制作,包括 2 万部展示桌面上物体碰撞的合成视频和一组自然语言数据集,其中包括与视频内物体相关的问题和答案。总共有超过 30 万个这样的问题和答案,它们被分为描述性、解释性、预测性和反事实性等类别。


麻省理工学院-IBM 沃森实验室负责人大卫·考克斯 (David Cox) 在一次采访中向 媒体透露,他坚信 Clevrer 数据集将有助于创造混合 AI,混合 AI 结合了神经网络和符号 AI。考克斯表示,IBM 研究团队 (IBM Research) 将把该方法应用于 IT 基础设施管理和工厂、建筑工地等工业环境。


考克斯称:“我认为这个数据集对几乎所有类型的应用都很重要。“通过该数据集,我们可以将世界简单化为许多到处移动的球,这也正是观察世界、了解世界、以及做计划并改变世界的第一步。因此,我们认为这个数据集的应用或将横跨多个领域,而视觉和机器人技术则是很好的开始。”


麻省理工学院-IBM 沃森 AI 实验室成立于三年前,旨在取得与广义 AI 主题相关的颠覆性进展。该实验室如 ObjectNet 等一些成果凸显了 ImageNet 之类的深度学习成功案例相对薄弱,所以该实验室已把重心转向了神经网络和符号或经典 AI 的结合上。


符号 AI 和神经网络一样,已经存在了几十年之久。考克斯认为,神经网络在等待着合适的条件出现,如足够多的数据和足够多的计算符号,与此同时 AI 也在等待着神经网络的发展,以便再度复苏。


考克斯说,这两种 AI 的互补性很好,如果能够结合,我们便可以用更少的数据和更高的效能来打造更稳健和更可靠的模型。在年初与 VentureBeat 的一次访谈中,IBM 研究团队负责人达里奥·吉尔 (Dario Gil) 称神经符号 AI 将成为 2020 年最重要的进展之一。


考克斯说,不论你想得到什么结果,通过神经符号 AI,你都可以表征知识或程序,而不是像神经网络那样映射输入和输出。因此,这或许能够使 AI 更好地帮助我们解决现实世界的问题。


考克斯称,“谷歌有一条数据之河,亚马逊也有,这些都不是坏事,但我们绝大多数的问题更像是智力游戏,所以我们认为,要向前发展,真正让 AI 不再是概念上的炒作,我们需要建立能够实现这一点的系统,这些系统有逻辑组件,可以能够灵活地重新配置自己,可以根据环境和实验采取行动,可以解释这些信息,并拥有其认知世界的内在心理模型”。


麻省理工学院-IBM 沃森 AI 联合实验室成立于 2017 年,总投资 2.4 亿美元。


原文链接:


https://venturebeat.com/2020/04/28/mit-researchers-release-clevrer-to-advance-visual-reasoning-and-neurosymbolic-ai/


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-06-08 10:281233
用户头像
李冬梅 加V:busulishang4668

发布了 792 篇内容, 共 365.1 次阅读, 收获喜欢 992 次。

关注

评论

发布
暂无评论
发现更多内容

全栈必备:系统架构设计的十个思维实验

这我可不懂

系统架构 全栈 软件系统

黄东旭:The Future of Database,掀开 TiDB Serverless 的引擎盖

PingCAP

数据库 开源 TiDB pingCAP

扫盲低代码

互联网工科生

前端 低代码 应用开发

使用 njs 0.7.7 提高 NGINX 配置的模块化程度和可复用性

NGINX开源社区

GaussDB(for Redis)多租户:读写权限控制和数据库隔离的完美融合

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

Ubuntu 22.04系统如何设置固定IP地址。

百度搜索:蓝易云

云计算 Linux ubuntu 运维 IP

自定义字体服务 - 基于Node的Web字体解决方案

疯狂紫萧

前端 nodejs 字体

Java 命令行参数解析方式探索(二):Apache Commons CLI

冰心的小屋

Java 命令行 console Apache Commons CLI

MobPush 创建推送

MobTech袤博科技

前端 消息推送 智能推送 前端‘’ 推送系统

PingCAP 陈煜琦:深耕中国市场,构建客户成功生态

PingCAP

MySQL 数据库 开源 TiDB pingCAP

前端视角的可观测性(一)

林十二XII

java面试-数据库

程序员小张

软件测试 | MySQL创建或者修改视图

测吧(北京)科技有限公司

测试

中原银行SQL治理实践

中原银行

SQL优化

低代码开发为什么能长盛不衰?

力软低代码开发平台

5分钟迁移关系型数据库到图数据库

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

MatrixOne:HTAP数据库中的OLAP设计

MatrixOrigin

云原生 超融合 HTAP MatrixOrigin MatrixOne

推荐 9 个很牛的项目管理软件

高端章鱼哥

项目管理 软件 企业管理软件

软件测试 |BTREE索引与HASH索引

测吧(北京)科技有限公司

测试

2023牛客网最新版Java面试题及答案整理

架构师之道

Java 面试

关于直播间APP源码的开发,你了解多少?

山东布谷网络科技

1v1交友app开发

4个维度重构组织能力,实现人力资源数智化

用友BIP

人力资源

实践分析丨AscendCL应用编译&运行案例

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 7 月 PK 榜

Swagger 自动生成 Api 文档:提高效率的利器

Liam

程序员 接口文档 swagger 自动生成 API 文档

Vulkan并非“灵药“

江湖修行

移动端 opengl Android; 渲染

用友BIP助力企业全球化运营与人才管理

用友BIP

中企出海 数智人力

软件测试 | 创建触发器

测吧(北京)科技有限公司

测试

Linux系统-hydra爆破工具使用教程。

百度搜索:蓝易云

云计算 Linux 运维 Hydra 暴力

Flink Metrics&REST API 介绍和原理解析

腾讯云大数据

流计算 Oceanus

共话AIGC与企业数字化转型 PolarDB开源数据库技术沙龙南京站报名中!

阿里云数据库开源

数据库 postgresql 阿里云 开源 polarDB

大一统真的来了:多模态共享参数的 Meta-Transformer

Zilliz

meta Towhee 多模态大模型

哈佛大学联合MIT研究人员发布了Clevrer数据集,以推进视觉推理和神经符号AI的发展_文化 & 方法_KHARI JOHNSON_InfoQ精选文章