写点什么

零就业保障、全天精神“酷刑”!ChatGPT 类产品背后 80% 贡献者,时薪 1.16 美元,但也没得选

  • 2024-07-08
    北京
  • 本文字数:4274 字

    阅读完需:约 14 分钟

大小:1.99M时长:11:34
零就业保障、全天精神“酷刑”!ChatGPT类产品背后80%贡献者,时薪1.16美元,但也没得选

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

整理 | 华卫、核子可乐 

 

“人工智能技术旨在使琐碎的工作自动化,但事实上,人们在被迫做更多常规、无聊和技能较低的工作。”甚至时薪不到 2 美元,工作条件还令人发指。这可能是每个关注人工智能行业的人都有必要一听的真实探访故事。

 

近期,三位分别来自牛津互联网研究所(Oxford Internet Institute)和埃塞克斯大学(University of Essex)的学者,通过数百次访谈和数千小时的实地考察,公开揭露了经常被刻意隐藏在大众视线之外的人工智能产业底层纪实。他们分别是詹姆斯·马尔登(James Muldoon)、马克·格雷厄姆(Mark Graham)和卡勒姆·坎特(Callum Cant)。

 

“大型科技公司正在以人类的体力和智力工作为食,无论是员工、创意人员、数据注释员还是内容审核员。”像亚马逊的人工智能系统中,供应链组织技术已经自动化了思维过程,而人类在亚马逊仓库里要做的就是残酷、重复的高劳力劳动过程,因为他们的工作场所里加入了算法管理系统。

 

“当我们看到一个人工智能产品时,我们倾向于认为它是相对自发创造的,而没有考虑人类劳动、资源需求以及它背后发生的一切。”实际上,人工智能产品背后 80%的工作是数据注释,而不是机器学习工程。以自动驾驶汽车为例,一小时的视频数据需要 800 个人工小时的数据注释。

 

在去往肯尼亚和乌干达、评估当地数据注释与内容审核中心工作条件的实地考察中,这三位学者与几十名数据注释员进行了交谈。据他们称,现在社交媒体内容和人工智能训练数据的审核和标注工作多外包给南半球地区的工人。“在那里,长时间工作、低工资和接触令人不安的内容是常态。”

体力和精神被榨干

 

内容审核员的任务就是手动浏览社交媒体帖子,负责删除有害内容并标记出违反公司政策的行为。数据注释员则为数据打上相关标签,帮助计算机算法更好地理解其中内容。在幕后默默运作的这两类“数据工作”让我们的数字生活成为可能,而背后从业者们的工作经历却极端到令人不安,毕竟这份工作的要求确实非常严格。

 

一位从尼日利亚移民到乌干达的数据工作者表示,“我们的体力被榨干、精神也被榨干,每天活得如同行尸走肉。”轮班时间很长,工人们必须在速度和准确性方面满足严格的绩效要求。

 

Mercy 是一名为 Meta 工作的外包内容审核员,她需要在 10 个小时的轮班期间每 55 秒处理一张“工单”,工作就是确定其是否违反了公司提出的暴力或露骨内容封禁规则。其中,暴力与煽动比简单的霸凌和骚扰就更严重,所以单单发现一种违规行为还不算完,工作人员必须认真观察整个过程,揪出每一个违规细节,以防轻判导致恶劣内容的广泛传播。

 

另一位审核人员解释称,“最令人不安的不仅仅是暴力,还有露骨的色情和令人不安的内容。”审核员们“几乎每天都会”目睹自杀、酷刑和强奸内容。这位审核员坦言,“种种不正常的畸形和病态,成为他们最平常的工作体验。”

 

最严重的是,这些数据工作者不断受到极端图像和视频的轰炸,但根本没有时间消化自己受到的心理冲击。他们每天平均要处理 500 到 1000 张工单,许多人表示自己的内心已经麻木不仁,甚至造成了毁灭性的后果。

 

一位被公司解雇的审核员指出,“我们大多数人都受到了心理创伤,有些人曾试图自杀……也有些员工的伴侣因为工作问题而离开了他们。”

 

另一位员工表示,“公司的政策比工作本身还要严苛。”一位内容审核中心员工在看到斩首视频后情绪崩溃、浑身颤抖,但管理层对此给出的建议却简单而粗暴:可以在一周中选个时间休息 30 分钟,跟公司的“健康顾问”聊聊。但所谓健康顾问,是根本没接受过正式心理培训的公司同事。

 

而那些因为无法承受视频内容而逃离办公桌的员工则被视为违反公司规定,因为他们没有及时在电脑上提交明确的“挂起”或者“出恭”状态码,所以相应的工作效率分可能被相应扣除。

 

类似的故事数不胜数:“我在办公室晕倒了”、“我患上了严重的抑郁症”、“我需要去看大夫”、“他们根本不关心我们的健康”。雇员们再三重申,管理层所做的就只有监控医院记录来核实员工是否有资格提请病假,但从来不会安慰或真正关心他们的健康状况。

就业保障为零,“你不干,有的是人想干”

跟数据打交道的审核和标注工作是我们熟知的日常产品和技术服务的运行基础——从社交媒体应用到聊天机器人,再到最新自动化技术。如果没有内容审核员在后台不断处理各种帖子,那么社交网络很快就会被充斥着暴力与露骨内容的素材所吞没;如果没有数据标注员创建的数据集,AI 算法就很难了解如何区分红绿灯和路牌信息,自动驾驶汽车自然也将无法上路;如果没有训练机器学习算法的雇员,也根本不可能出现像 ChatGPT 这样掀起 AI 革命浪潮的新工具。

 

然而,这些数据工作者的就业保障也几乎为零。大多数员工签订的都是一到三个月的短期合同,客户订单完成后就可能原地下岗。他们的雇主是 Meta 的客户,Meta 是一家总部位于旧金山的著名业务流程外包(BPO)公司,在东非设有交付中心,将不够稳定且标价过低的工作分配给当地员工。

 

包括 Mercy 在内的许多雇员之前就居住在附近的基贝拉贫民窟中,这里是非洲最大的城市贫民窟,所以哪怕是如此可怕的岗位对当地弱势居民来说已经算是份福利。据员工们称,公司会要求投诉者闭嘴,并提醒他们“你不干,有的是人想干”。于是,相当一部分雇员都害怕惹恼管理层,因为他们担心失去这份工作。

 

这些数据工作者中肯尼亚人占主体,但也有一些是来自其他非洲国家的移民,在这里主要负责帮助 Meta 审核其他非洲语种素材。部分移民员工表示由于言谈举止与当地人有别,他们在街上经常受到肯尼亚警方的骚扰和虐待。而且,警察骚扰并不是他们面临的唯一危险。

 

一位女性审核员描述了周边非洲国家“解放阵线”成员因为对审核决定不满而搜索 Meta 审核员姓名和照片,并在网上对其发布人身威胁的情形。雇员们当然很害怕,但公司只回应称他们会考虑加强生产设施的安保,但除此之外只能由员工“自求多福”、自己想办法远离危险。

 

据透露,这样模式的数据处理工作在全球多个国家的不同地点持续运作,涵盖数百万从业人员。在詹姆斯·马尔登等人开展考察之后,Mercy 所在的工作场所条件有所好转。但像 Meta 这样的大公司往往拥有多家外包审核服务提供商,他们都愿意为了拿下合同而做出让步......

 

如今的科技巨头们可以利用其财富和权力,随意调配 AI 领域之内数字劳动力在全球范围内的布局,而这自然造成了严重的生存状态差异。南半球国家的大多数工人,都就职于非正规的企业部门。由于失业率高得惊人,多数人很难找到拥有就业保障的高薪工作,弱势工人不仅愿意接受更低的工资待遇,甚至可以在工作条件方面做出重大让步,毕竟他们很清楚自己很容易被替代。

 

而将工作外包给南半球国家之所以成为企业的首选,并不在于他们愿意为贫困群体提供急需的经济机会,而是因为这是一条通往高纪律性、高效率水平和低成本劳动力的确切路径。

百亿估值的市场下,工人时薪 1.16 美元

一说起 AI 开发,人们脑海中可能会自然而然浮现出身在硅谷光鲜亮丽、冷气充实的办公室里写代码的那群工程师。但大多数人没有意识到,整个 AI 模型训练期间有 80%的时间其实是用在了数据集标注身上。无论是自动驾驶汽车、纳米手术机器还是无人机,这些前沿技术都是在古卢这样的地区被孕育而成。

 

Anita 是一名在为某家自动驾驶汽车公司做项目的数据工作者,在乌干达北部最大城市古卢的一家 BPO 企业工作。她的工作是连续几个小时观看司机驾驶的镜头,寻找一切可能代表注意力不集中的视觉证据,类似“打瞌睡”的情况。这有助于制造商根据司机的面部表情和眼球运动开发“车内行为监控系统”。

 

而这份每周工作 45 个小时、精神高度紧张且压力巨大的工作所带来的回报,是每个月大约 80 万乌干达先令,折合 200 美元多一点。换算成时薪就是约 1.16 美元,这还不算偶尔出现的无偿加班。

 

就在此刻,全球数据标注市场正在蓬勃发展。据估计,2022 年这部分业务的总价值为 22.2 亿美元,后续预计每年将以 30%左右的速度增长,到 2030 年将超过 170 亿美元。随着 AI 工具在零售、医疗保健及制造业(仅列举几个有代表性的转型期行业)中的广泛应用,全球市场对于数据处理的需求将继续与日俱增。

 

并且,Anita 及其同事们的工作和生活都要受到严格的数字监控与记录。从开始使用生物识别装置打卡进入办公地点的那一刻起,他们就时刻身处于全方位覆盖的闭路电视摄像机网络之下。他们的工作电脑上还安装有效率监控软件,轮班期间每一秒的操作都会被记录在案。

 

一部分数据工作者甚至认为,管理层在员工内部建立了一套告密网络,以确保随时掌握雇员们的反抗行为或者建立工会的计划。

 

连续几个小时不停地工作,对于身体和心理都是一种难以恢复的消耗。而这里的员工几乎没有接受疏导的机会——任务被简化到最极端的形式,以最大限度提高工人们的效率和生产力。反复培训之下,标注员已经习惯于以最快的速度一遍又一遍执行相同的例行操作。结果就是,人们身上普遍出现一种共性:极端的无聊加上令人窒息的焦虑。

 

这就是被掩藏在 AI 革命前沿之下的现实:人们在极度紧张和时时刻刻的监控下工作,只为了保住饭碗、能够养家糊口。

 

结语

 

我们使用的每一款 AI 产品,都链接着全球各地打工人们的生活。无论大家是否喜欢,这种联系都客观存在。我们必须清醒地认识到,使用搜索引擎、聊天机器人,甚至是智能扫地机这样的产品,都意味着我们享受到了全球数据与资本的迅速流动,也最终在地球各个角落的雇员、组织和消费者之间织起了供求的大网。

 

科技企业当然清楚这背后隐藏的残酷真相,因此他们会尽可能将产品制造环节隐藏起来,同时刻意展现一种靓丽、时尚且自主的科技发展姿态——计算机搜索大量数据,边运行边自学。至于这些数据从哪里来,负责整理这些数据的是怎样一群报酬低廉、生活困苦的人们,他们是向来不愿提及的。

 

但更可怕的是,没人会主动辞去这份数据外包工作——因为在乌干达的国土上,根本没有更好的选择。只要有其他机会,哪怕是足够把人逼疯的审核和标注岗位,这里的人们也会牢牢抓住。他们的面前只有一条路:埋头苦干、完成目标,保证无论发生什么自己都不会被解雇。


 *本文采自詹姆斯·马尔登(James Muldoon)、马克·格雷厄姆(Mark Graham)和卡勒姆·坎特(Callum Cant)三位合著的《喂养机器:为人工智能提供动力的隐藏人类劳动》一书的部分节选内容。 

参考链接:

https://www.theguardian.com/technology/article/2024/jul/06/mercy-anita-african-workers-ai-artificial-intelligence-exploitation-feeding-machine

https://www.theguardian.com/technology/article/2024/jul/06/james-muldoon-mark-graham-callum-cant-ai-artificial-intelligence-human-work-exploitation-fairwork-feeding-machine

 

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2024-07-08 16:534453

评论

发布
暂无评论

首届LoongArch生态创新大会成功召开,筑巢引凤共建信息产业命运共同体

OpenAnolis小助手

开源 芯片 白皮书

低代码实现探索(十六)业务勾连复杂验证器

零道云-混合式低代码平台

吐槽一下网站

你?

Linux之df命令

入门小站

Linux

只需5步!在轻量应用服务器部署Hexo博客

阿里云弹性计算

Hexo 轻量征文 用户投稿

转换匹配患者记录,看Amazon Lake Formation FindMatches显神通!

亚马逊云科技 (Amazon Web Services)

analytics

Flink 实践教程-进阶(6):CEP 复杂事件处理

腾讯云大数据

流计算 Oceanus

效果提升28个点!基于领域预训练和对比学习SimCSE的语义检索

百度大脑

人工智能

openGauss 助力邮储银行分布式新核心迈向智能运维时代

openGauss

助力产教融合,夯实数据库产业人才基座!openGauss社区分委会正式成立

openGauss

如何使团队的git log更优雅

阿呆

#GitLab

openGauss数据库源码解析系列文章——存储引擎源码解析(五)

openGauss

恒源云(GPUSHARE)_语音识别与语义处理领域之低资源机器翻译综述

恒源云

机器翻译 语音识别

在线常用crontab表达式大全验证解析

入门小站

工具

腾讯云原生实时数仓建设实践

腾讯云大数据

flink window 流计算 Oceanus

3个重点,20个函数分析,浅析FFmpeg转码过程

奔着腾讯去

音视频 WebRTC ffmpeg RTMP RTSP

Mysql索引

zdd

MySQL

阿里云手机正式公测,定义手机全新接入方式

阿里云弹性计算

阿里云 弹性云手机

数云运维总监陈延宗:基于阿里云计算巢,数云CRM一键云上交付

阿里云弹性计算

弹性计算 年度峰会 计算巢

基于实例数据详解准确率和召回率

华为云开发者联盟

数据集 AUC 信息检索 准确率 召回率

在Spark Scala/Java应用中调用Python脚本,会么?

华为云开发者联盟

Python spark python脚本 Spark Scala Java应用

圆桌对话:云时代下,企业运维面临的挑战与机遇

阿里云弹性计算

运维峰会 圆桌对话

2021年12月券商App行情刷新及交易体验评测报告

博睿数据

使用Amazon Redshift Simple Replay实用程序简化Amazon Redshift RA3迁移评估

亚马逊云科技 (Amazon Web Services)

mad

专注于最有价值的事情!——亚马逊云科技首席科学家工作心得分享

亚马逊云科技 (Amazon Web Services)

Date

呼叫医生云! Amazon HealthLake 现已正式上线

亚马逊云科技 (Amazon Web Services)

AI ML

腾讯云 AI 视觉产品基于流计算 Oceanus(Flink)的计费数据去重尝试

腾讯云大数据

AI flink window

使用 Simple Replay 实用程序简化 Amazon Redshift RA3 迁移评估

亚马逊云科技 (Amazon Web Services)

mad

开源demo| 智慧协同demo升级——协同更直观方便

anyRTC开发者

音视频 白板 智慧协同 开源demo 远程协助

透析阿里云视频云「低代码音视频工厂」之能量引擎——vPaaS视频原生应用开发平台

阿里云视频云

云计算 阿里云 音视频 低代买

物联网场景中灵活实施对设备的控制管理

亚马逊云科技 (Amazon Web Services)

零就业保障、全天精神“酷刑”!ChatGPT类产品背后80%贡献者,时薪1.16美元,但也没得选_生成式 AI_华卫_InfoQ精选文章