Administrator
发布于 2026-05-19 / 4 阅读
0
0

数字智能 | 投喂AI:人工智能产业的全球底层工人纪实

Feeding the Machine — The Hidden Human Labour Powering AI

詹姆斯·马尔登 / 马克·格雷厄姆 / 卡勒姆·坎特 著|贾青青 车一凡 译


"没有人工,就没有人工智能。"
人正在成为 AI 的生产原料——这是一个近乎残忍的现实。


壹|核心命题:AI 是一台剥削机器

  • AI 不是神赐的魔法,是人类劳动的产物——数据标注、内容审核、工程开发、仓库分拣……每一个 AI 功能背后,都有看不见的人工支撑

  • AI 吸收三种"原料":物质资源(电力/水/芯片)、人力劳动(标注/审核/工程)、集体智能(全人类积累的知识与语言)

  • "机械土耳其人"的现代翻版:AI 看似自主运行,实则箱子里藏着真人棋手——全球数百万隐形劳动者在维持它的运转

  • 核心悖论:机器已经能画画、作曲、写诗,人类却不得不像机器一样,从事单调乏味、收入微薄的工作,只为让这些非凡的机器成为可能

  • 剥削逻辑链:AI 公司→外包公司→"全球南方"劳动者,价值在最底层创造,利润在最顶层聚集


贰|7位主角:AI产业链的人间切面

🔵 安妮塔——乌干达数据标注员

  • 每天凌晨5点步行2小时上班,月薪约200美元(折合时薪约1.16美元)

  • 工作内容:盯着自动驾驶录像,标注司机面部表情,帮AI学会识别人类疲劳

  • 现实处境:

效率软件实时监控每一秒,效率分不达标名字变红

每日9小时高强度标注,休息超1小时即扣分

短期合同(1~2个月),随时被替换

曾遭受管理层性骚扰,举报无门

  • 她的梦想:存钱卖家具,逃出这个困境——但攒的钱刚够孩子学费

🔵 默茜——肯尼亚内容审核员

  • 为 Meta(Facebook)审核违规内容,每55秒处理一条报告,每日工作10小时

  • 最残忍的一天:工作时突然发现屏幕上循环播放的,是记录祖父车祸死亡的视频

  • 主管安慰后,依然要求她完成当天任务

  • 审核员们"几乎每天"观看自杀、虐待、强奸影像,被迫"司空见惯"

  • 心理创伤:部分审核员自杀,伴侣离去,公司仅提供每周30分钟"健康咨询"(实为无资质同事兼任)

  • 就业保障形同虚设:合同期1~3个月,害怕失业不敢发声

🔵 李——伦敦机器学习工程师

  • 高薪、优渥的硅谷式办公环境,负责开发大语言模型 Minerva

  • 管理两支标注团队:菲律宾低薪团队(基础评分)+ 伦敦专业团队(高质量答案范本)

  • 内心困境:

清楚知道"全球南方"劳动者的工作条件

公司为抢市场不断走捷径,伦理防护不足

"她只是庞大机器中的一个齿轮"——知道模型有偏见,却无力改变

🔵 埃纳尔——冰岛数据中心技术员

  • 守护着支撑AI运转的物理基础设施:服务器机架、冷却系统、光缆接口

  • 冰岛数据中心卖点:100%可再生能源、全年低温免费风冷、政治稳定

  • 他是处于"全球基础设施权力网络中心"的普通人——大银行、政府、AI公司的数据都经他手

🔵 劳拉——爱尔兰配音演员

  • 惊愕地发现:自己的声音已被擅自合成为AI版本,AI"劳拉"正在争夺她的工作

  • 创意劳动被剥夺的缩影:AI模型大量使用艺术家的作品训练,却不支付报酬

🔵 亚历克斯——英国亚马逊仓库员工

  • 站在同一位置,每天重复数千次相同动作,满足AI管理系统的效率指标

  • 从扫描枪到头顶摄像头,全程被AI监控

  • 加入员工自发组织的罢工,争取加薪

🔵 保罗——肯尼亚内容审核员工会组织者

  • 克服重重阻力,在非洲创立了首个内容审核员工会

  • 他的故事揭示:劳动者有能力组织变革,但代价极大


叁|AI的生产解剖:从"标注"到"运行"的完整链条

数据标注:AI的"口粮"

  • 大约80%的AI训练时间花在数据标注上,但这部分劳动最不透明

  • 全球数据标注市场规模:2022年约22.2亿美元,预计2030年超180亿美元,年增速约30%

  • 标注员平均时薪:众包平台约2美元,外包中心约1~2美元,仅是美国最低工资的零头

  • Karya案例:数据工作者创造的价值是其工资的200多倍;时薪中位数仅10~50美分,而其数据售价是工资的200倍+(劳动者仅获得0.5%的回报)

内容审核:AI无法替代的人类判断

  • 每位审核员每日处理500~1000条违规内容

  • 这些判断同时构建"训练数据集",反过来训练AI审核系统

  • 恶性循环:人类的痛苦,成为机器学习的原料

工程师层:看不见的伦理代价

  • 大语言模型并不"思考",只是根据概率猜词——本质是"随机鹦鹉"(Stochastic Parrots)

  • 主要局限:

无法理解句子的真正含义,只能分析语言模式

会"幻觉"(编造事实)、存在偏见、无法自查

"逆转诅咒":知道"A是B的妈妈",不代表知道"B的妈妈是A"

  • 训练数据主要来自互联网(Common Crawl),而互联网用户以年轻白人男性为主→偏见被放大复制

数据中心:AI的"身体"

  • AI不是"飘浮在云端",而是存在于嗡嗡作响、散发热量的服务器机架中

  • 全球数据中心耗电量占全球总耗电量的2%~3%(相当于法国一年用电量)

  • 单个服务器机架耗电量7年内翻超一倍:不到10千瓦→44~66千瓦


肆|殖民性:AI不平等的历史根源

  • AI生产网络延续了殖民时代的权力模式

高薪稳定岗位→美国、欧洲核心城市

低薪危险岗位→"全球南方"边缘地区

  • 关键矿产→非洲、拉美开采→运往西方加工

  • 基贝拉(内罗毕最大贫民窟)的隐喻

1899年英国殖民铁路(连接内陆与英帝国)

2009年东非海底光缆(接入全球互联网)

铁路和光缆做了同一件事:把基贝拉的劳动者纳入全球剥削网络

  • 数字连接≠议价平等:乌干达外包公司无法与特斯拉平起平坐,"扁平世界"从未真正扁平

  • "知识的殖民性":AI的训练数据基于西方知识体系,AI被包装成白人面孔和白人声音,强化殖民等级


伍|劳动管控的历史传承

时代

场所

控制手段

17世纪

加勒比蔗糖种植园

群体制度:监工监督全程,控制过程而非结果

19世纪

美国棉花种植园

数据升级:称重棉花、每日三次记录,差一磅打一鞭

19世纪末

费城钢铁工厂

泰勒科学管理:系统监控+动作分解

21世纪

数据标注中心

AI监控:效率软件+生物识别+摄像头,精确到秒

  • 当代数据中心对劳动者的监控超过了最严苛的种植园主

  • 奴役劳动→雇佣劳动,暴力体罚→效率扣分,本质相同:用数据控制人体的每一秒


陆|AI五大真实风险(当下,非未来)

虚假信息与操控选举:生成式AI让"量身定制的谎言"规模化成为可能,一对一渗透数百万选民

算法偏见固化歧视:AI在贷款审批、简历筛选、刑事司法中加剧对少数族裔和女性的歧视

生物武器门槛降低:大语言模型6小时内可生成化学战剂配方,开源模型进一步扩散此能力

AI驱动的战争扩大化:以色列"福音"系统用AI生成打击名单,"薰衣草"系统标记37000个目标,平民伤亡大幅扩大

工作管理系统侵蚀所有行业:算法管理最先在弱势劳动者身上测试,成功后迅速推广——没有人能逃离监控


柒|AI时代的权力格局

  • "大AI"的基础设施权力:亚马逊、谷歌、微软、Meta + OpenAI、Anthropic、英伟达垄断算力、数据和资金

  • 全球大型数据中心超过一半属于三家大公司

  • 英伟达一家占机器学习GPU市场95%

  • 平台时代 vs AI时代

平台时代:轻资产(爱彼迎无房,优步无车)

AI时代:"基础设施权力"(数据中心+海底光缆+AI芯片)→资本密集型门槛极高

  • 监控资本主义升级:从"追踪你的浏览行为卖广告",到"追踪你的每一秒工作行为来剥削劳动"


捌|五项改变路径:如何拆除剥削机器

路径一:增强劳动者集体力量

  • 加入工会,实现集体谈判

  • "共同决定"制度:劳动者代表进入董事会(德国模式)

  • 员工持股计划(迈德纳计划、英国工党提案)

  • 道格拉斯定律:"权力从不主动让步。不施压,无所得。"

路径二:让企业承担责任

  • 公平劳动项目(Fairwork):10条原则评分(0~10分),曝光逼企业整改

  • Sama案例:从0分→5分,完成24项工作条件改进(含最低工资、延长合同、取消无偿加班)

  • 企业怕负面声誉,声誉压力是有效杠杆

路径三:政府监管(三层)

  • 上游监管(难度最高):在外包所在国推行劳工保护,但企业随时可撤离

  • 下游监管(效果显著):在大市场国家立法,企业不敢失去市场准入

德国《供应链法》:员工3000人以上的公司须确保全供应链最低标准

欧盟《企业可持续性发展尽职调查指令》:将低于生活工资纳入违规行为

  • 全网监管:国际劳工组织公约,覆盖187个成员国

路径四:劳动者合作社

  • Karya案例(印度班加罗尔):

数据工人时薪约5美元(远超印度最低工资)

公共数据许可证:劳动者集体拥有数据集所有权,可从多次转售中持续获益

某案例转售后,劳动者时薪达到约1000卢比(约12美元,印度最低工资40倍)

  • 局限:融资难、难规模化,无法在大型数据中心领域与巨头竞争

路径五:挑战整个系统

  • 认清根本问题:资本主义逻辑决定了AI的发展路径

  • 历史示范:奴隶制被废除不是靠感化奴隶主,而是靠权力平衡转变

  • 工程师拒绝提供监控技术、亚马逊员工罢工、内容审核员联合组建工会——变革正在发生


玖|核心金句

"人正在成为AI的生产原料。"
——田丰(中国社会科学院研究员)

"AI训练数据堪称全球利润最丰厚的资产之一,然而,从事这项工作的劳动者所获得的回报微乎其微。"
——Karya联合创始人萨菲亚·侯赛因

"权力从不主动让步。过去不会,将来也不会。不施压,无所得。"
——弗雷德里克·道格拉斯(19世纪美国废奴运动领袖)

"最悲哀的不是失去安全感,而是我们无法想象事情可以变得更好。"
——哲学家恩斯特·布洛赫

"与无人剥削的痛苦相比,被资本家剥削的痛苦微不足道。"
——经济学家琼·罗宾逊(关于发展中国家的两难困境)

"终有那么一刻,我们必须挺身而出,用我们的血肉之躯去阻挡那无情的齿轮……唯有自由之光普照,这台机器方能重新焕发生机。"
——马里奥·萨维奥(1964年,加利福尼亚大学伯克利分校)

"他们的故事就是我们的故事。"
——本书作者


拾|行动清单:每个人能做什么

  • 消费者:关注AI产品背后的劳工条件,支持公平劳动认证(Fairwork评分高)的企业和平台

  • 工程师/技术人员:不为政府提供监控技术,在职场内推动伦理政策落地;拒绝接受"市场竞争"作为忽视伦理的借口

  • 管理者/HR:了解自己采购的AI服务是否建立在不公正劳工体系上;要求供应链透明

  • 政策制定者:借鉴德国《供应链法》和欧盟尽职调查指令,将AI外包纳入监管

  • 所有人:加入或支持工会;学会识别算法管理在自己工作中的侵蚀;建立跨国劳动者连带


拾壹|关键数据速查

数据点

数值

全球AI市场规模(2023年)

>2000亿美元,年增速约20%

预计2030年AI市场规模

~2万亿美元

全球数据标注市场(2022年)

约22.2亿美元

众包平台标注员平均时薪

约2美元

Karya数据工作者时薪

约5美元(但创造价值是工资200倍以上)

AI训练时间中用于标注的比例

约80%

AI领域教授中男性占比

约80%

高盛预测被AI取代岗位

约3亿个

数据中心耗电占全球总量

2%~3%

英伟达占机器学习GPU市场份额

约95%

超过一半的大型数据中心

属于3家大公司



评论