【ArchSummit架构师峰会】精华内容上线75%,AI大模型中台从理念到实践的探索!>>> 了解详情
写点什么

NLP 社区调查问卷结果公布:“NLP 寒冬”将在未来 30 年内来临

  • 2022-10-30
    北京
  • 本文字数:1244 字

    阅读完需:约 4 分钟

NLP社区调查问卷结果公布:“NLP 寒冬”将在未来 30 年内来临

来自纽约大学华盛顿大学约翰斯·霍普金斯大学的研究者们发布了NLP社区调查问卷的结果,问卷中收集了 480 位业界活跃的 NLP 研究员们对于 AI 领域自然语言处理中几个问题的想法。问卷中也包括了一些元问题,是关于对其他研究人员的看法。


问卷的目标是表现 NLP 社区中观念的真实分布情况,以及社会学理念——研究人员对其他研究人员观念的看法。问卷的调查范围是在过去三年中在 NLP 领域至少发表过 2 篇论文的研究人员。问卷中的问题涵盖了 NLP 研究的六个大类,也包括了通用人工智能(Artificial General Intelligence AGI)和社会焦点问题。团队选择了社区中经常讨论的问题,也有引发公众分歧的课题。


不可避免地,我们主观地挑选了一系列问题,然后将复杂问题转化为简单的衡量标准,但是我们希望的是,问卷的结果能够给社区讨论以及以后的问卷一些参考意见。这不是任何辩论的最终言论,但是我们希望这可以激发新的讨论,作为人们所持有的立场范围的初始研究,也能够让社区避免误导自己。


问卷调查中的问题涵盖了以下类别的内容:

  • 领域的状态:工业所扮演的角色,以及近期出现“AI 寒冬”的可能性;

  • 规模化、归纳偏见以及毗邻领域:是大型规模适合解决 NLP 问题,还是需要语言学的经验来解决 NLP 问题;

  • AGI 和主要风险:NLP 研究是否在向着 AGI 发展,AGI 是否会带来社会风险;

  • 语言理解:语言模型是否真的理解了语言;

  • 未来研究方向:NLP 研究是否在正确的轨道上;

  • 伦理:NLP 是否带来积极的影响,以及某些研究领域是否是遵循伦理的。


除了详述他们是否同意某一个问题,受访者需要预测其他受访人同意这个问题的概率。收集这些元回复的目的是帮助研究人员理解社会学理念,因为错误的社会学理念会“减缓沟通以及导致精力的浪费“

关于拓展 AI 模型在 NLP 问题解决中扮演的角色的问题,在 NLP 研究人员实际的想法和他们认为的社区信念之间出现了“惊人的不匹配”。问卷的受访人群估计,接近 50%的研究人员同意,规模化能够解决 “几乎所有“ 问题,以及不到 40%的研究人员觉得解决重要问题需要的是语言学理论和专家设计。 然而,在一个高亮部分结果的Twitter 讨论中,主要作者 Julian Michael 指出:


研究领域中不到 20%的人认为扩展现有的技术,将足够解决所有应用中的 NLP 问题。大多数人认为,语言学或者认知科学视角将成为未来发展的重点部分。


在 Hacker News 关于当前AI技术的局限性的讨论中,AI 作者和研究员 Gwern Branwen引用了 NLP 问卷的结果,并且为规模化辩护:


AGI 和规模化的反对者仍占主流,尽管他们摆出了受压迫的少数群体的姿态……如果你支持规模化,那么你仍旧是研究人员中的少数群体,追求着不流行而且具有广泛争议的范式。(尽管不受欢迎而且规模很小,它仍旧产生如此不可思议的结果且有着首屈一指的表现,在我看来,是值得赞扬的,这也是为什么新晋研究人员应该进行拓展探索的最好的论据之一——它仍旧被低估着)


虽然调查论文已经包括了图表和数据摘要,但是调查问卷的网站表示,用于探索结论的基于web的面板“即将推出”。


原文链接:

University Researchers Publish Results of NLP Community Metasurvey

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-10-30 08:003743

评论 1 条评论

发布
用户头像
意义
2022-10-31 14:18 · 广东
回复
没有更多了
发现更多内容

如何做需求分析?

万事ONES

产品经理 需求分析 ONES

真happy软件开发|真happy系统APP开发

NumPy_2021.07.05

Flychen

国家网信办:“滴滴出行” 下架整改!

学神来啦

Rust从0到1-Cargo-发布到Crates.io

rust 发布 cargo crates.io publish

Vue.js+ElementUI+vant生成动态表单配置

二郎神杨戬

7月日更

IPC阿波罗公链软件系统开发搭建

北鲲云超算平台——致力于提高科研效率,降低计算成本的云超算平台

北鲲云

海洋之星系统开发|海洋之星软件APP开发

Go 学习笔记之 整型数据类型

架构精进之路

Go 语言 7月日更

如何给MindSpore添加一个新的硬件后端?快速构建测试环境!

华为云开发者联盟

AI 模型 框架 mindspore

多标签分类中的损失函数与评价指标

月来客栈

PyTorch 多标签 多标签分类 文本分类

架构之:微服务和单体服务之争

程序那些事

微服务 系统架构 软件架构 程序那些事

一条SQL语句执行的背后

卢卡多多

log sql 更新 执行顺序 7月日更

UD众筹链/UD生态系统APP开发详情

2022秋招vue面试题+答案

buchila11

Vue Vue 3

根据舌苔判断身体状况

kof11321

快看吧系统开发|快看吧软件APP开发

微摩尔WMO软件系统开发介绍

GIN钱包挖矿系统开发|GIN钱包挖矿软件APP开发

社交软件上“你可能认识的人”到底是怎么找到你的?

华为云开发者联盟

知识图谱 社交软件 TransE模型 用户画像 知识图谱补全

【Flutter 专题】96 图解 Draggable + DragTarget 基本拖拽效果

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 7月日更

XRP瑞波币系统开发|XRP瑞波币软件APP开发

JAVA 九种排序算法详解(中)

加百利

Java 数组 排序 7月日更

Camtasia实用技巧之智能聚焦

淋雨

视频剪辑 Camtasia 专业录屏

BHDEX币挖矿APP系统开发内容

项目经理的职责和权限分别是什么?

万事ONES

项目管理 ONES 项目经理

联想科技产业行——大众集团走进联想:智慧科技赋能汽车行业智能化变革

科技大数据

科技互联网 新未来 联想

富文本编辑器之游戏角色升级ing

vivo互联网技术

Java 大前端 富文本 富文本编辑器

JavaScript数组详解-全网最全

二郎神杨戬

7月日更

聚星公社软件开发|聚星公社APP系统开发

NLP社区调查问卷结果公布:“NLP 寒冬”将在未来 30 年内来临_AI&大模型_Anthony Alford_InfoQ精选文章