写点什么

对抗铺天盖地的假新闻,MIT 开发 AI 检测系统自动识别虚假消息

  • 2019-10-22
  • 本文字数:1949 字

    阅读完需:约 6 分钟

对抗铺天盖地的假新闻,MIT开发AI检测系统自动识别虚假消息


互联网时代,假新闻铺天盖地,而且极具迷惑性,Facebook 一度深陷虚假新闻的泥淖,不但被控影响了美国总统大选结果,甚至引发了德国政府的巨额罚款。我们不禁想到,能否利用人工智能强大的能力,来对抗假新闻呢?麻省理工学院计算机科学与人工智能实验室就为此做出了尝试。


假新闻是一种威胁,假新闻的大致定义为,通过传统媒体或社交媒体故意散布虚假信息的一种宣传。皮尤研究中心(Pew Research Center)在 2016 年 12 月的一项调查显示,有 23% 的美国成年人有意无意地与朋友和其他人分享过假新闻。研究显示,假新闻已经开始削弱公众对主要电视和报纸媒体的信任。Monmouth University 的一项调查显示,77% 的受访者称,他们认为媒体报道的全都是假新闻。在一个特别令人震惊的例子中,关于华盛顿特区一家披萨店的一则不真实的报道(但像病毒一样广为传播),导致在一项 1244 人参与的民意调查中,有 9% 的美国选民表示,他们认为前国务卿 Hillary Clinton 与一个儿童色情团伙有牵连。


为了引起人们对这一问题的关注,最近,麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人员调查了所谓的假新闻探测器被真实文章愚弄的方式。与这项工作同时进行的是,同一个团队还使用了世界上最大的事实核查数据集之一来开发能够检测虚假陈述的自动化系统。


它是建立在麻省理工学院计算机科学与人工智能实验室去年进行的一项研究的基础上,该研究开发了一种人工智能系统,可以判断消息来源是准确的,还是带有政治偏见的。


研究人员的两篇预印论文中的第一篇《我们安全了吗?假新闻检测中分布特征的局限性》(Are We Safe Yet? The Limitations of Distributional Features for Fake News Detection),描述了基于 OpenAI 的 GPT-2 的框架,这是一种人工智能模型,他们在将人工书写的文本提供给假新闻探测器之前,先用人工智能模型“破坏”这个文本的含义。在一次实验中,他们利用类似于可靠来源的自动完成工具来生成有关合法新闻的信息。生成器(Generator)提供了一个有关 NASA 如何收集日冕物质抛射数据的报道,并就这些数据如何帮助科学家研究地球磁场发表了翔实且正确的解释。尽管如此,它还是被识别为“假新闻”,这表明,如果假新闻探测器是机器生成的,它就无法区分真假文本。


该研究的贡献者、麻省理工学院教授 Regina Barzilay 表示:“我们的这一发现对当前分类器的可信度提出了质疑,这些分类器被用来帮助检测其他新闻来源中的错误信息方面。”


在第二篇论文《经过去偏的事实核查模型的探讨》(Towards Debiasing Fact Verification Models)中,该团队获取了事实提取和验证(Fact Extraction and VERification,FEVER),这是一个虚假陈诉的存储库,与 Wikipedia 的文章中的证据进行交叉核查,以开发出一种同类最佳的事实检查算法。


问题在于,接受过 FEVER 训练的系统往往侧重于陈述的语言,而不考虑外部证据。(例如,像“Adam Lambert does not publicly hide his homosexuality”(亚当·兰伯特并没有公开隐藏自己的同性恋身份)这样的陈述,即使是真正的事实,并且可以从语料库中推断出来,它也有可能被事实核查人工智能判定为假新闻。当目标语句包含的信息在今天是正确的,但在将来却有可能被认为是错误的信息,这种影响会加剧。


为解决这一问题,合著者创建了一个数据集来消除 FEVER 的偏见,但此举并没有完全解决这一难题。模型在无偏评估集上表现不佳,研究人员将这一结果归因于这些模型过度依赖于它们最初接触到的偏见。最终的解决方案是设计一种全新的算法:当在经过去偏的数据集上进行训练时,该算法在所有指标上的表现都优于之前的事实核查 AI。


该团队希望将事实核查和现有防御相结合,使模型对抵御攻击的能力更加健壮。未来,他们希望能够通过开发新的算法和构建涵盖更多类型错误信息的数据集来进一步改进现有模型。


他们并不是唯一试图与人工智能对抗假新闻转播的人。总部位于印度德里的初创公司 MetaFact 利用自然语言处理算法来标记新闻报道和社交媒体帖子中的错误信息和偏见。AdVerif.ai 是一个软件即服务的平台,去年发布了测试版,它用于分析错误信息、裸体、恶意软件和其他有问题的内容,并交叉引用一个定期更新的数据库,其中包含数以千计的虚假和合法的新闻条目。就 Facebook 而言,它已经尝试部署人工智能工具来“识别账户和假新闻”。


无论最终的解决方案是人工智能、人类管理还是两者兼而有之,都不可能很快就会实现。Gartner 预测,如果目前的趋势持续下去的话,到 2022 年,发达国家的大多数人将会看到更多的虚假信息,而不是真实信息。

作者介绍

Kyle Wiggers 居住在美国纽约市,是 VentureBeat 的人工智能专栏作者。


原文链接:


https://venturebeat.com/2019/10/15/mit-csail-fights-fake-news-with-ai/


2019-10-22 08:003010

评论

发布
暂无评论
发现更多内容

独家巨献!阿里技术专家兼Github贡献者,整理的Spring Security入门到成神

Geek_0c76c3

Java 数据库 开源 程序员 开发

旺链科技入选2022“科创中国”创新成果名单

旺链科技

区块链 金融科技 产业区块链

你好,广州!openGauss广州用户组招募计划正式开启

Zebec即将推出公链并开放节点申请,潜力几何?

西柚子

Flowable 中 ReceiveTask 怎么玩?

江南一点雨

Java springboot workflow flowable JavaEE

【iOS逆向】某运营商签名算法分析

小陈

逆向思维 逆向 iOS逆向 逆向分析

如何优雅地编写一个高逼格的JS插件?

茶无味的一天

JavaScript 前端 js JS插件

如何快速打造BI大屏进行数据赋能

力软低代码开发平台

【荣耀帐号服务FAQ】AuthorizationCode有效期是多久?

荣耀开发者服务平台

手机 服务 安卓 荣耀 honor

Vue网站自动提交百度链接

源字节1号

软件开发 后端开发 Vue网站

软件测试 | 测试开发 | Java or Python?测试开发工程师如何选择合适的编程语言?

测吧(北京)科技有限公司

测试

DAG 任务调度与 go-streams 结合的应用实践

KaiwuDB

如何从InfluxDB/OpenTSDB无缝连接到TDengine

TDengine

数据库 tdengine 开源 时序数据库

10分钟开发Kubernetes Operator

俞凡

架构 Kubernetes 云原生

32天高效突击:狂刷《Java权威面试指南(阿里版)》,offer拿到手软!

Geek_0c76c3

Java 数据库 开源 程序员 开发

大数据ELK(十九):使用FileBeat采集Kafka日志到Elasticsearch

Lansonli

Filebeat 10月月更

软件测试 | 测试开发 | Google 测试总监聊如何经营成功的测试职业生涯

测吧(北京)科技有限公司

测试

易操作、可观测、可扩展,EMQX如何简化物联网应用开发

EMQ映云科技

运维 物联网 IoT emqx 10月月更

网络安全漏洞分析之远程代码执行

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

企业社会责任先行,公益课程推动环保科普教育

科技之家

知道了web的攻击方式,还不快防起来?

CoderBin

前端 安全 10月月更

Google 发布:DevOps 2022现状报告

SEAL安全

DevOps 研发效能 软件交付 软件供应链

干货|仅需3步完成酷炫数据可视化大屏制作!

云智慧AIOps社区

大前端 低代码 数据可视化 智慧大屏可视化 可视化大屏

《编程的原则》读书笔记(二): 编程理论的三个思想和六个实现原则

Chares

软件工程 软件开发 编程原理 软件开发原则

智能合约系统开发Web3.0实现核心

薇電13242772558

智能合约

GitLab + Jenkins + Harbor 工具链快速落地指南

胡说云原生

DevOps gitlab cicd Harbor jenkins

创新公司iLabService 释普科技启示录

B Impact

C语言中的内存模型

C++后台开发

内存模型 C语言 C/C++ linux开发 C++开发

【一Go到底】第九天---进制

指剑

Go golang 10月月更

两将军问题和TCP三次握手

有态度的马甲

TCP协议 两将军问题

SQL抽象语法树及改写场景应用

京东科技开发者

sql SQL优化 场景应用 SQL语言 抽象语法树

对抗铺天盖地的假新闻,MIT开发AI检测系统自动识别虚假消息_AI&大模型_Kyle Wiggers_InfoQ精选文章