写点什么

零就业保障、全天精神“酷刑”!ChatGPT 类产品背后 80% 贡献者,时薪 1.16 美元,但也没得选

  • 2024-07-08
    北京
  • 本文字数:4274 字

    阅读完需:约 14 分钟

大小:1.99M时长:11:34
零就业保障、全天精神“酷刑”!ChatGPT类产品背后80%贡献者,时薪1.16美元,但也没得选

整理 | 华卫、核子可乐 

 

“人工智能技术旨在使琐碎的工作自动化,但事实上,人们在被迫做更多常规、无聊和技能较低的工作。”甚至时薪不到 2 美元,工作条件还令人发指。这可能是每个关注人工智能行业的人都有必要一听的真实探访故事。

 

近期,三位分别来自牛津互联网研究所(Oxford Internet Institute)和埃塞克斯大学(University of Essex)的学者,通过数百次访谈和数千小时的实地考察,公开揭露了经常被刻意隐藏在大众视线之外的人工智能产业底层纪实。他们分别是詹姆斯·马尔登(James Muldoon)、马克·格雷厄姆(Mark Graham)和卡勒姆·坎特(Callum Cant)。

 

“大型科技公司正在以人类的体力和智力工作为食,无论是员工、创意人员、数据注释员还是内容审核员。”像亚马逊的人工智能系统中,供应链组织技术已经自动化了思维过程,而人类在亚马逊仓库里要做的就是残酷、重复的高劳力劳动过程,因为他们的工作场所里加入了算法管理系统。

 

“当我们看到一个人工智能产品时,我们倾向于认为它是相对自发创造的,而没有考虑人类劳动、资源需求以及它背后发生的一切。”实际上,人工智能产品背后 80%的工作是数据注释,而不是机器学习工程。以自动驾驶汽车为例,一小时的视频数据需要 800 个人工小时的数据注释。

 

在去往肯尼亚和乌干达、评估当地数据注释与内容审核中心工作条件的实地考察中,这三位学者与几十名数据注释员进行了交谈。据他们称,现在社交媒体内容和人工智能训练数据的审核和标注工作多外包给南半球地区的工人。“在那里,长时间工作、低工资和接触令人不安的内容是常态。”

体力和精神被榨干

 

内容审核员的任务就是手动浏览社交媒体帖子,负责删除有害内容并标记出违反公司政策的行为。数据注释员则为数据打上相关标签,帮助计算机算法更好地理解其中内容。在幕后默默运作的这两类“数据工作”让我们的数字生活成为可能,而背后从业者们的工作经历却极端到令人不安,毕竟这份工作的要求确实非常严格。

 

一位从尼日利亚移民到乌干达的数据工作者表示,“我们的体力被榨干、精神也被榨干,每天活得如同行尸走肉。”轮班时间很长,工人们必须在速度和准确性方面满足严格的绩效要求。

 

Mercy 是一名为 Meta 工作的外包内容审核员,她需要在 10 个小时的轮班期间每 55 秒处理一张“工单”,工作就是确定其是否违反了公司提出的暴力或露骨内容封禁规则。其中,暴力与煽动比简单的霸凌和骚扰就更严重,所以单单发现一种违规行为还不算完,工作人员必须认真观察整个过程,揪出每一个违规细节,以防轻判导致恶劣内容的广泛传播。

 

另一位审核人员解释称,“最令人不安的不仅仅是暴力,还有露骨的色情和令人不安的内容。”审核员们“几乎每天都会”目睹自杀、酷刑和强奸内容。这位审核员坦言,“种种不正常的畸形和病态,成为他们最平常的工作体验。”

 

最严重的是,这些数据工作者不断受到极端图像和视频的轰炸,但根本没有时间消化自己受到的心理冲击。他们每天平均要处理 500 到 1000 张工单,许多人表示自己的内心已经麻木不仁,甚至造成了毁灭性的后果。

 

一位被公司解雇的审核员指出,“我们大多数人都受到了心理创伤,有些人曾试图自杀……也有些员工的伴侣因为工作问题而离开了他们。”

 

另一位员工表示,“公司的政策比工作本身还要严苛。”一位内容审核中心员工在看到斩首视频后情绪崩溃、浑身颤抖,但管理层对此给出的建议却简单而粗暴:可以在一周中选个时间休息 30 分钟,跟公司的“健康顾问”聊聊。但所谓健康顾问,是根本没接受过正式心理培训的公司同事。

 

而那些因为无法承受视频内容而逃离办公桌的员工则被视为违反公司规定,因为他们没有及时在电脑上提交明确的“挂起”或者“出恭”状态码,所以相应的工作效率分可能被相应扣除。

 

类似的故事数不胜数:“我在办公室晕倒了”、“我患上了严重的抑郁症”、“我需要去看大夫”、“他们根本不关心我们的健康”。雇员们再三重申,管理层所做的就只有监控医院记录来核实员工是否有资格提请病假,但从来不会安慰或真正关心他们的健康状况。

就业保障为零,“你不干,有的是人想干”

跟数据打交道的审核和标注工作是我们熟知的日常产品和技术服务的运行基础——从社交媒体应用到聊天机器人,再到最新自动化技术。如果没有内容审核员在后台不断处理各种帖子,那么社交网络很快就会被充斥着暴力与露骨内容的素材所吞没;如果没有数据标注员创建的数据集,AI 算法就很难了解如何区分红绿灯和路牌信息,自动驾驶汽车自然也将无法上路;如果没有训练机器学习算法的雇员,也根本不可能出现像 ChatGPT 这样掀起 AI 革命浪潮的新工具。

 

然而,这些数据工作者的就业保障也几乎为零。大多数员工签订的都是一到三个月的短期合同,客户订单完成后就可能原地下岗。他们的雇主是 Meta 的客户,Meta 是一家总部位于旧金山的著名业务流程外包(BPO)公司,在东非设有交付中心,将不够稳定且标价过低的工作分配给当地员工。

 

包括 Mercy 在内的许多雇员之前就居住在附近的基贝拉贫民窟中,这里是非洲最大的城市贫民窟,所以哪怕是如此可怕的岗位对当地弱势居民来说已经算是份福利。据员工们称,公司会要求投诉者闭嘴,并提醒他们“你不干,有的是人想干”。于是,相当一部分雇员都害怕惹恼管理层,因为他们担心失去这份工作。

 

这些数据工作者中肯尼亚人占主体,但也有一些是来自其他非洲国家的移民,在这里主要负责帮助 Meta 审核其他非洲语种素材。部分移民员工表示由于言谈举止与当地人有别,他们在街上经常受到肯尼亚警方的骚扰和虐待。而且,警察骚扰并不是他们面临的唯一危险。

 

一位女性审核员描述了周边非洲国家“解放阵线”成员因为对审核决定不满而搜索 Meta 审核员姓名和照片,并在网上对其发布人身威胁的情形。雇员们当然很害怕,但公司只回应称他们会考虑加强生产设施的安保,但除此之外只能由员工“自求多福”、自己想办法远离危险。

 

据透露,这样模式的数据处理工作在全球多个国家的不同地点持续运作,涵盖数百万从业人员。在詹姆斯·马尔登等人开展考察之后,Mercy 所在的工作场所条件有所好转。但像 Meta 这样的大公司往往拥有多家外包审核服务提供商,他们都愿意为了拿下合同而做出让步......

 

如今的科技巨头们可以利用其财富和权力,随意调配 AI 领域之内数字劳动力在全球范围内的布局,而这自然造成了严重的生存状态差异。南半球国家的大多数工人,都就职于非正规的企业部门。由于失业率高得惊人,多数人很难找到拥有就业保障的高薪工作,弱势工人不仅愿意接受更低的工资待遇,甚至可以在工作条件方面做出重大让步,毕竟他们很清楚自己很容易被替代。

 

而将工作外包给南半球国家之所以成为企业的首选,并不在于他们愿意为贫困群体提供急需的经济机会,而是因为这是一条通往高纪律性、高效率水平和低成本劳动力的确切路径。

百亿估值的市场下,工人时薪 1.16 美元

一说起 AI 开发,人们脑海中可能会自然而然浮现出身在硅谷光鲜亮丽、冷气充实的办公室里写代码的那群工程师。但大多数人没有意识到,整个 AI 模型训练期间有 80%的时间其实是用在了数据集标注身上。无论是自动驾驶汽车、纳米手术机器还是无人机,这些前沿技术都是在古卢这样的地区被孕育而成。

 

Anita 是一名在为某家自动驾驶汽车公司做项目的数据工作者,在乌干达北部最大城市古卢的一家 BPO 企业工作。她的工作是连续几个小时观看司机驾驶的镜头,寻找一切可能代表注意力不集中的视觉证据,类似“打瞌睡”的情况。这有助于制造商根据司机的面部表情和眼球运动开发“车内行为监控系统”。

 

而这份每周工作 45 个小时、精神高度紧张且压力巨大的工作所带来的回报,是每个月大约 80 万乌干达先令,折合 200 美元多一点。换算成时薪就是约 1.16 美元,这还不算偶尔出现的无偿加班。

 

就在此刻,全球数据标注市场正在蓬勃发展。据估计,2022 年这部分业务的总价值为 22.2 亿美元,后续预计每年将以 30%左右的速度增长,到 2030 年将超过 170 亿美元。随着 AI 工具在零售、医疗保健及制造业(仅列举几个有代表性的转型期行业)中的广泛应用,全球市场对于数据处理的需求将继续与日俱增。

 

并且,Anita 及其同事们的工作和生活都要受到严格的数字监控与记录。从开始使用生物识别装置打卡进入办公地点的那一刻起,他们就时刻身处于全方位覆盖的闭路电视摄像机网络之下。他们的工作电脑上还安装有效率监控软件,轮班期间每一秒的操作都会被记录在案。

 

一部分数据工作者甚至认为,管理层在员工内部建立了一套告密网络,以确保随时掌握雇员们的反抗行为或者建立工会的计划。

 

连续几个小时不停地工作,对于身体和心理都是一种难以恢复的消耗。而这里的员工几乎没有接受疏导的机会——任务被简化到最极端的形式,以最大限度提高工人们的效率和生产力。反复培训之下,标注员已经习惯于以最快的速度一遍又一遍执行相同的例行操作。结果就是,人们身上普遍出现一种共性:极端的无聊加上令人窒息的焦虑。

 

这就是被掩藏在 AI 革命前沿之下的现实:人们在极度紧张和时时刻刻的监控下工作,只为了保住饭碗、能够养家糊口。

 

结语

 

我们使用的每一款 AI 产品,都链接着全球各地打工人们的生活。无论大家是否喜欢,这种联系都客观存在。我们必须清醒地认识到,使用搜索引擎、聊天机器人,甚至是智能扫地机这样的产品,都意味着我们享受到了全球数据与资本的迅速流动,也最终在地球各个角落的雇员、组织和消费者之间织起了供求的大网。

 

科技企业当然清楚这背后隐藏的残酷真相,因此他们会尽可能将产品制造环节隐藏起来,同时刻意展现一种靓丽、时尚且自主的科技发展姿态——计算机搜索大量数据,边运行边自学。至于这些数据从哪里来,负责整理这些数据的是怎样一群报酬低廉、生活困苦的人们,他们是向来不愿提及的。

 

但更可怕的是,没人会主动辞去这份数据外包工作——因为在乌干达的国土上,根本没有更好的选择。只要有其他机会,哪怕是足够把人逼疯的审核和标注岗位,这里的人们也会牢牢抓住。他们的面前只有一条路:埋头苦干、完成目标,保证无论发生什么自己都不会被解雇。


 *本文采自詹姆斯·马尔登(James Muldoon)、马克·格雷厄姆(Mark Graham)和卡勒姆·坎特(Callum Cant)三位合著的《喂养机器:为人工智能提供动力的隐藏人类劳动》一书的部分节选内容。 

参考链接:

https://www.theguardian.com/technology/article/2024/jul/06/mercy-anita-african-workers-ai-artificial-intelligence-exploitation-feeding-machine

https://www.theguardian.com/technology/article/2024/jul/06/james-muldoon-mark-graham-callum-cant-ai-artificial-intelligence-human-work-exploitation-fairwork-feeding-machine

 

2024-07-08 16:534544

评论

发布
暂无评论

FabEdge V0.5.0 新特性:支持跨集群服务访问

BoCloud博云

开源 边缘计算 cncf

教育行业可以用云管平台吗?有案例介绍吗?

行云管家

云计算 企业上云 云管平台 云管理

通过IPv6隧道实现天翼云云主机IPv4和IPv6双栈接入

天翼云开发者社区

网络

使用天翼云主机组功能让云主机不放在同一个篮子里

天翼云开发者社区

行业分析| 音视频呼叫邀请适用于多领域

anyRTC开发者

音视频 WebRTC 语音通话 视频通话 呼叫邀请

“既要性能,也要安全”,这样的Rust,谁不喜欢!

非凸科技

rust 编程语言 软件开发 招聘

使用对等连接在天翼云两个用户的云网络之间架起一座天桥

天翼云开发者社区

还搞不明白,一次性给你总结好网络层概念

华为云开发者联盟

网络协议 IP 网络层 组网

安利一个小众但实用的导航网站(推荐收藏)

小炮

导航网站

给工厂做开发,竟然喝着咖啡听“交响”?

阿里云云效

云计算 阿里云 DevOps 研发 研发提效

中科柏诚:用数字技术纾困解难,助力中小企业恢复成长活力

联营汇聚

TDengine 助力智慧燃气,支撑数百万智能终端的接入管理

TDengine

Apache APISIX 2.13.0 发布

API7.ai 技术团队

开源 API网关 API Gateway Apache APISIX

大数据培训-Flink面试知识分享

@零度

flink 大数据开发

芯片变得更复杂的今天,你需要最大限度复用IP资源

龙智—DevSecOps解决方案

芯片行业思考 芯片开发 ip复用 ip资源 芯片行业

NetCore性能排查

神农写代码

从0到100:基于微信小程序的羽毛球馆预约系统的开发笔记

CC同学

围绕用户体验持续进化 英特尔Evo平台打造开放、多元创新优势

科技新消息

OceanBase 在证券行业基金资管场景落地实践与解决方案

OceanBase 数据库

证券 oceanbase

提高企业产品交付效率系列(1)—— 企业应用一键安装和升级

北京好雨科技有限公司

Kubernetes PaaS rainbond

提效24.3%!看OA预算管理系统的低代码开发实践

鲸品堂

低代码开发

web前端培训-通过JS 可以读取电脑上所有数据

@零度

JavaScript 前端开发

2022年中国音频行业产品洞察分析

易观分析

音频体验 在线音频

为什么要做等保二级,有什么好处?

行云管家

网络安全 等保 等保2.0

20万字《网易智企技术合辑》重磅发布!

网易云信

人工智能 大数据 大前端 即时通讯IM 音视频技术

菜鸟不菜,职场小白大变身

龙智—DevSecOps解决方案

Jira Jira插件 工作流扩展 并行审批 jira并行审批

在 Rainbond 中一键安装高可用 Nacos 集群

北京好雨科技有限公司

开源 Kubernetes nacos PaaS rainbond

【CI/CD研讨会报名,截止最后一天】全程参会,还有惊喜奖品等你拿!

龙智—DevSecOps解决方案

cicd 持续集成 jenkins CI/CD 持续发布

实战天翼云云主机系统盘扩容

天翼云开发者社区

云主机

Java篇|忘记格式化代码,把女朋友鸽了

Jianmu

Java 自动化 持续集成 建木CI 格式化代码

四大功能!带你初识 Fabric | 容器网络系列第2期

BoCloud博云

云原生 容器网络方案

零就业保障、全天精神“酷刑”!ChatGPT类产品背后80%贡献者,时薪1.16美元,但也没得选_生成式 AI_华卫_InfoQ精选文章