写点什么

Quora 的陨落:AI 时代知识社区的困境

  • 2024-03-05
    北京
  • 本文字数:4478 字

    阅读完需:约 15 分钟

大小:2.11M时长:12:16
Quora 的陨落:AI 时代知识社区的困境

这个网站曾经是一个充满活力的社区,然而现在用户正在逃离……


为什么有这么多音乐会使用Ticketmaster?”“要成为寿司厨师需要进行怎样的培训?”“武术家是如何打碎混凝土块的?”如果你是在 10 年前寻找这类问题的答案,那么最有可能找到详细、专业的回答的一个地方是互联网上最有趣、存在时间最长的社区之一:Quora。


大多数人都以某种形式接触过 Quora,无论他们是否知情:在谷歌搜索结果,在著名作家的写作示例中,在数字出版物转载的某些问答中,比如Slate。其中一位Slate-via-Quora的贡献者,作家兼研究员Erica Friedman,在 2011 年就加入了这个网站,当时 Quora 正因为Yahoo Answers的衰落而吸引到了一波流量。她说,这让 Quora 作为一个以准确性为重点、以知识为中心的文本平台脱颖而出。在这个 Facebook 和 Twitter 开始主导社交互联网、YouTube在做自己的事情的时代,它是一款独特的产品。


Friedman 对这个古怪的问答巨头如此着迷,并和其他许多人无偿贡献着答案。她说:“有一段时间,也就是在 2010 年代中期,我们很多人真的专注在一个特定的使命上,那就是‘让 Quora 成为互联网上一个说你不能在这里胡作非为的地方。我们把这些政策付诸行动,不让人们心怀不轨地来到这里做一些心怀不轨的事。’ ”一个聪明而充满激情的社区,致力于维护一个积极正向的空间——有什么比这更理想的呢?难怪 Quora 在 2010 年代会有如此迅猛的增长


然而,今天的 Quora 几乎与那些乌托邦的理想无关。这个曾经受人喜爱的论坛现在充斥着没完没了、无意义的、重复的垃圾,充满了奇怪的荒谬的令人生厌的、AI 生成的内容,以及一大堆全大写的非问题内容,比如“OMG! KING CHARLES SHOCK the WORLD with ROYAL BAN ON PRINCE HARRY AND MEGHAN MARKLE. SAD?(天哪!查尔斯国王宣布王室禁止哈里王子和梅根·马克尔结婚,震惊世界。应该感到悲伤?)”这个“问题”的答案,获得了约700万点击量,链接到一个奇怪的、几乎无法使用的皇室观察网站 red-carpett.com。以前你可以在谷歌上搜索时事问题,并在搜索结果的前几名找到 Quora 答案的链接,而现在,你更可能遇到像是一群人在 2024 年询问一贯的种族主义者特朗普是否真的是种族主义者。或者,特色的谷歌片段会告诉你,鸡蛋会融化,这要感谢搜索爬虫捕捉到了 Quora 网站上毫无意义的回答。


这真的很滑稽。Quora 通过搜索引擎优化让自己排名靠前,但又在自己的页面上提供 ChatGPT 的答案,因此这些答案传播到了谷歌的搜索结果中。


互联网正在崩溃 pic.twitter.com/gcV9b36vEA


——Tyler Glaiel (@TylerGlaiel) 2023年9月25日


Quora 的搜索引擎优化只会让更多的人关注到这个问题。各种论坛上的评论者都在哀叹Quora质量的下降,《大西洋月刊》最近发文问道:“如果没有愚蠢的问题,你会如何看待Quora?”如果你想看更多这种质量明显下降的例子,只需要浏览一下 Reddit 的“Insane People Quora”子版块。


Quora 的实用性缩水并非完全是因为 AI:长期以来的作者们认为,早在 ChatGPT 之前,Quora 就存在审核和功能方面的问题。但随着这个新知识经纪人的崛起,它的衰落在加速,这让本已分崩离析的社区感到更加愤怒。早些时候,支持 AI 加速的风投Andreessen Horowitz向 Quora 提供了一笔7500万美元的资金,但这也只是为了开发其现场生成文本聊天机器人 Poe。


在 2000 年代后期,Quora 相对于其他许多问答网站的优势在于它在设计时就考虑到了网络社交。联合创始人 Adam D'Angelo 和 Charlie Cheever 都是 Facebook 的早期员工,他们于 2009 年辞职,建立了一个网站,正如他们当时告诉TechCrunch的那样:“我们试图从人们的大脑中获取信息,而不是从互联网上那些难以获取的资源中获取,并将其转化为真正有用的格式,形成一个有价值的数据库。”他们的计划是说服专业领域的专家和寻知者分享他们的见解,并以此为基础,围绕这种真实、自由的信息交换建立一个充满活力的社区。Friedman 说,“有很多高质量的答案来自那些喜欢分享经验的人”,这与“从未建立起这种社区”的 Yahoo Answers 形成了鲜明的对比。


Quora前50万名用户之一Ariel Williams 对此表示赞同。她说:“Yahoo Answers 的质量很糟糕,你提出问题,就有人说一些恶心的话。Quora 注重质量,他们在寻找高质量的答案和问题,有积极的审核,整个网站都是围绕着人,围绕着用户建立的。”


不久之后,像Stan Hanks这样的专家开始出现。他是一位网络工程开创者建立了第一个IP 虚拟私人网络。2012 年末,他告诉我,他会登录到 Quora,“那里有一些我亲身经历东西、我知道的人和背景故事,这让我感到兴奋,我就会开始写。”


为了让志愿者专家们保持热情,Quora 推出了一系列福利,为 Quora 最优秀、最热情的回答者建立了一个 Top Writer 计划和一个激励深思讨论的系统,甚至邀请这些快乐的 Quora 用户参加在公司总部举办的峰会。本身就是 Top Writer 的 Williams 说:“Top Writer 计划从 2012 年一直持续到 2018 年。其中有一位曾与 Freeman Dyson 共事的物理学家,有 NASA 的工作人员,有博士学位的人。”


所有这些专家背后都有强大的人力支持。Hanks 说:“他们有审核团队、审查团队和支持团队。全职版主是 Quora 的员工,兼职版主有其他工作。”还有有偿工作的社区管理人员,他们秉持 BNBR(“友好、尊重”)的基本原则,以及客户服务支持人员和一个专门用于将特定问答发布到 Forbes 和 HuffPost 等网站的部门。


这个社交网络积累了数亿的页面浏览量,从投资者那里筹集了数百万美元,并在维基百科、Reddit 或 Facebook 之外开辟了一个独特的互联网角落。它可能没有像这些网站那样的知名度,但没关系——每个接触过 Quora 的人都知道它代表着什么。


但即便如此,仍有一些问题困扰着 Quora,并在之后继续恶化。首先,一位不愿透露姓名的前 Quora 用户告诉我,网站开始“缩短问题的长度”。公开的理由是为了增加 Quora 在谷歌上的可见度,但这种简洁是有代价的:这让用户难以提出专家可以回答的复杂的问题,包括极为具体的与业务相关的问题。 例如:“作为一名创始人,我应该获得多少股权来白手起家创办一家初创公司?他们给了我 10%的薪水,但可以稀释,和 CEO 一样。公司还没有开始,还没有原型。10%对于 CTO 来说是很低的。多少才是公平的?”



然后是前 Top Writer J. Starr(后来她把自己的账号删除)向我描述的“信息流优化”。起初,当用户登录到 Quora 时,他们看到的是他们来这里的目的:等待回答的问题。但很快,Quora 开始“将‘内容’文章放到每个人的信息流里”,用 Starr 的话来说,这里充斥着“各种垃圾信息,各种关于好莱坞的流言蜚语”。


早期的广告和机器人泛滥也是个问题。2016 年,Quora 开始在网站上投放广告,Williams 和其他 Top Writers 建议设立某种创作者分成计划。Williams 说,结果高层创建了“Quora合作伙伴计划,我自己也加入了。但这完全是为了让人们想出能够吸引更多浏览量的问题”——而不是为了激励高质量的答案。


Quora 的“合作伙伴”并不是唯一被招募来完成这项任务的人——Quora 还吸引到从 Reddit 提取问题并发布到 Quora 页面的机器人。这些都不是 Quora 社区想要的问题。Williams 说:“你会看到人们用‘最好的餐厅在哪里’这样的模板创建机器人,然后它会插入城市名、州名、国名。”r/Quora的Reddit用户开始注意到并抱怨这种做法。


另一位前 Top Writer Bethann Siviter说:“写作质量已经让位于纯粹的流量。随着合作伙伴计划的推出,数量变得比质量更重要,这一点非常明显。你可以一次又一次地举报,但什么都不会发生。”尽管合作伙伴计划并没有给参与者太多钱(最多可能是几千美元),但制造机器人的人很快就意识到,这是快速致富最简单的方法。


这一切都是由于 Quora 的变现速度缓慢造成的,而且尽管这个网站很受欢迎,但它的目标是在数字广告这块大蛋糕上分一杯羹,而这块蛋糕已经迅速被Facebook 和亚马逊(以及它的头号流量来源谷歌)占据。考虑到其高昂的开支,投资者对向 Quora 继续注资犹豫不决。因此,Quora 削减了预算,缩小了审核团队、客户支持体系和 Top Writer 计划。其他最初的功能——Quora 用户必须使用真实姓名、读者可以为存在错误或拼写错误的答案提出“建议编辑”——也被取消了。所有这些做法导致了更多未经检查的垃圾信息和大量的喷子的泛滥,志愿者用户无法自己阻止这些。


2013 年加入 Quora 的作者Nelson McKeeby表示,在“玩家门”事件之后,情况变得更糟。因为匿名和被削弱的审核,极右翼、喜欢特朗普的喷子们入侵了 Quora。他在一封电子邮件中写道:“当真正的用户试图撤下明显错误的答案,却抵不过拥有众多服务器的喷子们”。此外,随着 Quora 推出“Spaces”——基本上是由用户运营的私人社区博客——审核问题继续恶化,丑陋的意识形态变得猖獗。忠诚的 Quora 用户试图举报有偏见的恐同的淫秽的内容,但却没有得到 Quora 足够的支持。


然后,AI 来了。随着垃圾信息机器人的泛滥,Quora 改变了服务条款,取消了 BNBR,然后自动化了审核过程。不用说,这并没有让情况变好。AI 聊天机器人并没有提供好的问题或答案。相反,用户Steven P. Robinson在一封电子邮件中写道:“它们编造了一些非常普通且低水准的问题,这是 AI 尚未准备好迈入黄金时段的一个很好的例子。”现在,Quora 甚至还提供 AI 生成的图像来配合用户的答案,尽管生成的插图毫无意义。



最重要的是,Quora 开始使用 AI 在一些选定的问题页面上“生成机器答案”,并明确表示人类的回答可能被用于训练 AI。这意味着 Quora 用户提供的内容将免费提供给一个定制的大型语言模型。更新的服务条款和隐私政策于去年夏天生效。天使投资人(也是 Quora 用户)David S. Rose转述了其中一些条款:“你授予所有其他 Quora 用户无限的权利来重复和改写你的答案”、“你授予 Quora 使用你的答案来训练 LLM 的权利,除非你明确选择退出”,以及“你完全放弃参与任何针对 Quora 的集体诉讼的权利”,等等。Quora 的帮助中心声明:“到目前为止,我们不使用 Quora 上的答案、帖子或评论来训练用于在 Quora 上生成内容的 LLM,但这在未来可能会发生变化。”Quora 提供了一个选择退出的设置,尽管它承认“选择退出并不包括所有的内容”。


这引发了所有权问题,因为 Quora 用户必须决定是否同意新的条款或带着他们的作品离开。一些知名用户,比如奇幻作家 Mercedes R. Lackey 正在从其个人资料中删除他们的作品,并写下说明。Lackey 告诉我:“AI、服务条款问题已经导致 Quora 顶尖人才的大量流失。”并不是所有的 Quora 用户都想离开,但他们很难选择留在一个他们现在必须不断对抗错误、垃圾信息、喷子甚至帐号 冒名的网站上。


Quora 并不是唯一一个在 AI 时代面临存亡之战的数字社区——Reddit谷歌面临着相关的、尽管略有不同的担忧。Quora 的悲剧不仅在于它摧毁了曾经建立起来的繁荣社区。它把所有的善意、社区、专业知识和好奇心都带走了,并假定它可以自动化出一个系统,而显然并没有考虑到这种比较是多么的苍白。


McKeeby 对未来有一个令人沮丧的预测:“最终 Quora 将只剩下机器人提问、机器人回答,其他什么都没有了。”我想知道,如果有人愿意问的话,那么 Quora 将如何回答“为什么 Quora 会走向衰落”这个问题。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:https://slate.com/technology/2024/02/quora-what-happened-ai-decline.html

2024-03-05 16:295294

评论 1 条评论

发布
用户头像
没Quora,又何来训练数据。
2024-03-05 16:35 · 广东
回复
没有更多了
发现更多内容

VMware Workstation 17安装教程之轻松构建虚拟机

小齐写代码

火山引擎DataLeap背后的支持者 - 工作流编排调度系统FlowX

字节跳动数据平台

大数据 数据中台 数据安全 数据研发 企业号10月PK榜

社区迭代|ETLCloud社区新增“论坛”啦!

RestCloud

ETL 社区 论坛

携程商旅发布“全球影响力计划”

携程商旅

QA忙不过来怎么破?

BY林子

软件测试 QA

建立性能基线的实践方法

老张

性能测试 性能基线

Java基础面试题【Spring、Spring MVC、Spring Boot】进阶篇

派大星

Java 面试题

极盾故事|某头部私募基金“扩展检测响应XDR平台”建设

极盾科技

XDR扩展威胁检测响应

KaiwuDB 荣获“2023 IDC 中国可持续发展先锋案例”

KaiwuDB

智能问答技术在百度搜索中的应用

百度Geek说

百度搜索 智能问答 企业号10月PK榜

嵌入式框架设计中的四种常用模式

互联网工科生

嵌入式

飞码LowCode前端技术系列(二):如何便捷配置出页面 | 京东云技术团队

京东科技开发者

前端 低代码 低代码平台 企业号10月PK榜

高效集成|这一次,快人一步

RestCloud

ETL

厦门理工计算机与信息工程学院获“火焰杯”软件测试赛全国奖项

测试人

软件测试

焕新升级!新一代云原生可观测平台

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 华为云CCE容器服

2023 云栖大会 | 「动手实践」基于阿里云构建博学谷平台实时湖仓

Apache Flink

大数据 flink 实时计算

10月《中国数据库行业分析报告》已发布,深度剖析甲骨文大会Oracle技术新趋势

墨天轮

数据库 oracle postgresql opengauss 国产数据库

限时领票|走进 2023 · 云栖大会,看大咖对话开源

Apache Flink

大数据 flink 实时计算

一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?

GPU算力

DataGrip for Mac(数据库管理工具) 2023.2.3+注册码

展初云

Mac datagrip 数据库管理

硬件、数据、模型优化与分布式训练的实践

百度开发者中心

大模型 LLM LLMOps

带着问题去分析:Spring Bean 生命周期 | 京东物流技术团队

京东科技开发者

spring 生命周期 @Bean 企业号10月PK榜

Dubbo 路由及负载均衡性能优化

vivo互联网技术

负载均衡 dubbo 路由

Tampermonkey for Mac(油猴Safari浏览器插件)

展初云

Mac 油猴 Tampermonkey

大模型与Prompt模板全面升级

百度开发者中心

深度学习 大模型 LLM

深度学习预训练模型的突破与发展

百度开发者中心

模型训练 大模型 深度学习‘’ LLM

从图像生成到分类的深度学习策略

百度开发者中心

人工智能 深度学习 大模型 图像生成

Quora 的陨落:AI 时代知识社区的困境_生成式 AI_Nitish Pahwa_InfoQ精选文章