NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

对抗铺天盖地的假新闻,MIT 开发 AI 检测系统自动识别虚假消息

  • 2019-10-22
  • 本文字数:1949 字

    阅读完需:约 6 分钟

对抗铺天盖地的假新闻,MIT开发AI检测系统自动识别虚假消息


互联网时代,假新闻铺天盖地,而且极具迷惑性,Facebook 一度深陷虚假新闻的泥淖,不但被控影响了美国总统大选结果,甚至引发了德国政府的巨额罚款。我们不禁想到,能否利用人工智能强大的能力,来对抗假新闻呢?麻省理工学院计算机科学与人工智能实验室就为此做出了尝试。


假新闻是一种威胁,假新闻的大致定义为,通过传统媒体或社交媒体故意散布虚假信息的一种宣传。皮尤研究中心(Pew Research Center)在 2016 年 12 月的一项调查显示,有 23% 的美国成年人有意无意地与朋友和其他人分享过假新闻。研究显示,假新闻已经开始削弱公众对主要电视和报纸媒体的信任。Monmouth University 的一项调查显示,77% 的受访者称,他们认为媒体报道的全都是假新闻。在一个特别令人震惊的例子中,关于华盛顿特区一家披萨店的一则不真实的报道(但像病毒一样广为传播),导致在一项 1244 人参与的民意调查中,有 9% 的美国选民表示,他们认为前国务卿 Hillary Clinton 与一个儿童色情团伙有牵连。


为了引起人们对这一问题的关注,最近,麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人员调查了所谓的假新闻探测器被真实文章愚弄的方式。与这项工作同时进行的是,同一个团队还使用了世界上最大的事实核查数据集之一来开发能够检测虚假陈述的自动化系统。


它是建立在麻省理工学院计算机科学与人工智能实验室去年进行的一项研究的基础上,该研究开发了一种人工智能系统,可以判断消息来源是准确的,还是带有政治偏见的。


研究人员的两篇预印论文中的第一篇《我们安全了吗?假新闻检测中分布特征的局限性》(Are We Safe Yet? The Limitations of Distributional Features for Fake News Detection),描述了基于 OpenAI 的 GPT-2 的框架,这是一种人工智能模型,他们在将人工书写的文本提供给假新闻探测器之前,先用人工智能模型“破坏”这个文本的含义。在一次实验中,他们利用类似于可靠来源的自动完成工具来生成有关合法新闻的信息。生成器(Generator)提供了一个有关 NASA 如何收集日冕物质抛射数据的报道,并就这些数据如何帮助科学家研究地球磁场发表了翔实且正确的解释。尽管如此,它还是被识别为“假新闻”,这表明,如果假新闻探测器是机器生成的,它就无法区分真假文本。


该研究的贡献者、麻省理工学院教授 Regina Barzilay 表示:“我们的这一发现对当前分类器的可信度提出了质疑,这些分类器被用来帮助检测其他新闻来源中的错误信息方面。”


在第二篇论文《经过去偏的事实核查模型的探讨》(Towards Debiasing Fact Verification Models)中,该团队获取了事实提取和验证(Fact Extraction and VERification,FEVER),这是一个虚假陈诉的存储库,与 Wikipedia 的文章中的证据进行交叉核查,以开发出一种同类最佳的事实检查算法。


问题在于,接受过 FEVER 训练的系统往往侧重于陈述的语言,而不考虑外部证据。(例如,像“Adam Lambert does not publicly hide his homosexuality”(亚当·兰伯特并没有公开隐藏自己的同性恋身份)这样的陈述,即使是真正的事实,并且可以从语料库中推断出来,它也有可能被事实核查人工智能判定为假新闻。当目标语句包含的信息在今天是正确的,但在将来却有可能被认为是错误的信息,这种影响会加剧。


为解决这一问题,合著者创建了一个数据集来消除 FEVER 的偏见,但此举并没有完全解决这一难题。模型在无偏评估集上表现不佳,研究人员将这一结果归因于这些模型过度依赖于它们最初接触到的偏见。最终的解决方案是设计一种全新的算法:当在经过去偏的数据集上进行训练时,该算法在所有指标上的表现都优于之前的事实核查 AI。


该团队希望将事实核查和现有防御相结合,使模型对抵御攻击的能力更加健壮。未来,他们希望能够通过开发新的算法和构建涵盖更多类型错误信息的数据集来进一步改进现有模型。


他们并不是唯一试图与人工智能对抗假新闻转播的人。总部位于印度德里的初创公司 MetaFact 利用自然语言处理算法来标记新闻报道和社交媒体帖子中的错误信息和偏见。AdVerif.ai 是一个软件即服务的平台,去年发布了测试版,它用于分析错误信息、裸体、恶意软件和其他有问题的内容,并交叉引用一个定期更新的数据库,其中包含数以千计的虚假和合法的新闻条目。就 Facebook 而言,它已经尝试部署人工智能工具来“识别账户和假新闻”。


无论最终的解决方案是人工智能、人类管理还是两者兼而有之,都不可能很快就会实现。Gartner 预测,如果目前的趋势持续下去的话,到 2022 年,发达国家的大多数人将会看到更多的虚假信息,而不是真实信息。

作者介绍

Kyle Wiggers 居住在美国纽约市,是 VentureBeat 的人工智能专栏作者。


原文链接:


https://venturebeat.com/2019/10/15/mit-csail-fights-fake-news-with-ai/


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-10-22 08:001772

评论

发布
暂无评论
发现更多内容

生成式AI助力智能未来

百度开发者中心

#人工智能 ChatGPT 生成式AI 文心一言

ETL 小技巧:文件输出插件数据写入空闲时间阈值配置及作用

大河

缓冲区 ETL bboss 文件输出

五种 CSS 位置类型以实现更好的布局

这我可不懂

CSS web开发

​Elastic Stack最佳实践系列:Beats->ES,一个更轻型的架构选择

腾讯云大数据

ES

在数字化时代的挑战与解决:跨国大文件传输方法

镭速

大文件跨国传输 跨国快速传输大文件

生成式AI技术市场现状与发展前景展望

百度开发者中心

#人工智能 生成式AI 文心一言

Lightroom下载 图像处理软件Lightroom Classic 2023 mac完美激活版

mac

苹果mac Windows软件 Lightroom Classic 2023 lrc2023 数字图像处理软件

和鲸 × 临床医学丨“人”作为一生命体在 AI for Science 过程中的作用与交互

ModelWhale

数据科学 临床医学 AI for Science 交叉学科 临床研究

死锁产生的条件及解决方法

红袖添香

Java 多线程 死锁

电脑硬件迭代快,对仿真软件有什么影响?

智造软件

仿真软件 电脑硬件 结构仿真 电脑配置 硬件配置

生成式AI助力高效写作

百度开发者中心

大模型 #人工智能 ChatGPT 生成式AI

第三周作业

大肚皮狒狒

软件测试|人工智能如何帮助测试工程师解决问题?

霍格沃兹测试开发学社

用案例带你认识决策树,解锁洞察力

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

有奖活动 | 以代码之名,写出对Ta的爱

HarmonyOS开发者

HarmonyOS

生成式AI:全球科技革命的驱动力

百度开发者中心

教育 #人工智能 ChatGPT 生成式AI

带你读论文丨Fuzzing漏洞挖掘详细总结 GreyOne

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

低成本生成式AI技术:推动AI普及的关键

百度开发者中心

医疗 #人工智能 ChatGPT 文心一言

生成式AI:内容创作新革命

百度开发者中心

自然语言处理 内容 #人工智能 文心一言

头脑风暴小工具-影响地图

Bruce Talk

敏捷开发 Agile Product Owner 影响地图

AI与众包平台共铸新机遇

知者如C

企业国际大数据传输必须了解的5种跨国快速传输大文件工具

镭速

大文件传输 跨国传输大数据

分布式数据库架构:高可用、高性能的数据存储

互联网工科生

分布式数据库 高性能 高可用性

生成式AI引领未来传媒业发展趋势

百度开发者中心

媒体 #人工智能 生成式AI 文心一言

容器化微服务:用Kubernetes实现弹性部署

高端章鱼哥

Kubernetes 微服务 容器化

又一可视化低代码神器!云耀云服务器L实例正式发布

mecchi

软件开发 云主机 云服务器 博客搭建

《守望先锋 2》性能提升高达33%!英特尔锐炫从未止步

E科讯

2023 年如何将您的应用提交到 App Store

雪奈椰子

ios 开发 Windows ios 开发证书

技术领先的用友iuap平台,助力升级数智化底座、驾驭数智未来

用友BIP

2023全球商业创新大会

华为云GaussDB打造最可信的数据库,给世界一个更优选择

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

Easysearch 跨集群复制实战

极限实验室

easysearch

对抗铺天盖地的假新闻,MIT开发AI检测系统自动识别虚假消息_AI&大模型_Kyle Wiggers_InfoQ精选文章