系列:真实现状
一份有据可查、分级标注的分析报告,系统梳理人工智能对劳动市场的真实影响——区分已证实的事实、尚存争议的判断与流传甚广的谬误。既无恐慌,亦无粉饰,唯有证据。
三个截然不同的阵营在自说自话,没有一方完全正确。理解争论的结构,是理解证据的前提。
在所有公共议题中,鲜有话题能像人工智能与就业一样,在每寸版面上激发如此多自信满满却相互矛盾的论断。在同一周内,权威媒体可以先后刊发“AI将取代半数白领工作”与“AI创造的就业岗位多于其摧毁的——历史已经证明”。两个标题在技术上都站得住脚,但都不是全部真相。
这种混乱是结构性的,而非偶然。根源在于三场截然不同的辩论被混为一谈:当前正在发生什么(实证可测量)、到2030年将发生什么(有争议的预测)、以及未来20至50年将发生什么(真正的未知)。对长期结构性就业持悲观态度的研究者,与对短期总量就业增长持乐观态度的研究者,往往引用的是不同时间维度的数据——而双方可能同时正确。
此外,乐观立场背后也有政治经济学逻辑。开发AI的企业天然倾向于强调其技术创造的就业多于破坏的就业;工会和被替代的劳动者则倾向于记录所受损害。双方未必不诚实——但都在对哪些证据获得放大传播施加选择性压力。
本报告力求以严谨的方法论提供实用价值:每项论断均明确标注证据分级。数据清晰之处,直言其然;尚存争议之处,呈现双方可信立场;缺乏证据支持的论断——无论出自哪一阵营——同样如实指出。
将确证数据与有争议的预测区分开来,并对二者之间的差异保持坦诚。
高盛研究(2025)记录了AI暴露职业中22至25岁劳动者就业的可衡量、具统计显著性的下降。20至30岁技术相关岗位从业者的失业率自2025年初以来上升了约3个百分点。22至25岁软件开发者的就业量较2022年末峰值下降了约20%。斯坦福数字经济实验室的《煤矿中的金丝雀》(布林约尔松等,2025)也识别出这一群体是AI劳动市场影响的先行指标,与上述发现相互印证。
值得注意的是:总体就业仍在增长。这并非宏观层面的就业崩溃,而是特定AI暴露岗位初级招聘管道的定向压缩。信号集中在“谁能被录用开启职业生涯”这一环节,而非大规模裁员。
多项高质量随机对照实验证实,AI工具确实能提高生产率。布林约尔松(Brynjolfsson)、李(Li)和雷蒙德(Raymond)的研究(2025年发表于《经济学季刊》)是目前最严谨的研究,发现生成式AI使客服人员的平均生产率提高了14%,其中技能最低的劳动者获益最大。GitHub Copilot研究显示开发者编码速度提升约55%。核心发现在于:对大多数在岗劳动者而言,AI目前充当的是生产率放大器,而非替代品。替代效应主要体现在招聘端——所需新人减少——而非现有员工的裁撤。
美国非农企业中劳动收入份额从1980年的约64%降至2017年的约57%(阿西莫格鲁、马内拉和雷斯特雷波,2020)。这一先于AI的趋势反映了数十年资本偏向型自动化的结果:劳动的有效税率(约25%–34%)远高于资本(约5%–10%),激励企业以资本替代劳动。IMF研究(2024–2025)预测,AI可能进一步提高资本回报率、压缩劳动收入——但这一效应在很大程度上取决于AI是互补还是替代高收入劳动者,以及生产率收益是被资本所有者攫取还是以工资形式分配。
“生成式AI最广泛的影响,可能在于就业质量而非就业数量。”
——国际劳工组织(ILO/NASK全球指数,2025年5月)按职业类别排列的风险等级、暴露机制与预计时间线。风险百分比为基于模型的估算值(参见第02节警示)。
| 职业 | 任务暴露度 | 主要机制 | 时间线 | 证据 |
|---|---|---|---|---|
| 客服代表 | 大语言模型聊天机器人处理一级咨询;人工岗位缩减至异常情况处理 | 2024–2026(已在进行) | ✓ 已证实 | |
| 数据录入员 | 重复性数据处理被直接自动化;高精度OCR + AI | 2024–2027 | ✓ 已证实 | |
| 行政/秘书助理 | 日程安排、文件起草、文档管理、邮件处理——均可由AI复制 | 2024–2028 | ◈ 有力证据 | |
| 翻译/口译人员 | 大语言模型在标准商业翻译中已接近人类水平;就业下降已有文献记录 | 2023–2026(持续中) | ✓ 已证实 | |
| 簿记员/会计文员 | 常规财务数据处理完全可自动化;AI会计软件正在快速扩展 | 2025–2028 | ◈ 有力证据 | |
| 校对/文字编辑 | 语法与风格修正任务现已被AI以更高精度完成(针对标准内容) | 2023–2026 | ◈ 有力证据 |
来源:ILO/NASK全球指数 2025;高盛研究 2025;麦肯锡全球研究院;IMF SDN 2024
| 职业 | 任务暴露度 | 主要机制 | 时间线 | 证据 |
|---|---|---|---|---|
| 初级软件开发者 | 代码生成工具减少初级岗位需求;高级岗位生产率提升 | 2024–2028 | ✓ 已证实 | |
| 律师助理/法律助理 | 文件审查、法律检索、合同分析——均可由大语言模型快速复制 | 2025–2029 | ◈ 有力证据 | |
| 初级金融分析师 | 常规分析、报告生成、数据综合现已自动化;高级判断力得以保留 | 2025–2030 | ◈ 有力证据 | |
| 记者/内容撰稿人 | 数据新闻和标准化内容生成已实现自动化;调查性与叙事性报道受影响较小 | 2024–2028 | ◈ 有力证据 | |
| 放射科医生(筛查层) | AI在初步影像筛查中表现优于人类;角色转向复杂诊断与医患沟通 | 2026–2032 | ⚖ 有争议 | |
| 零售收银员 | 自助结账与无感零售正在扩张;Amazon Go模式持续推广 | 2024–2030 | ◈ 有力证据 |
| 职业 | 任务暴露度 | 主要机制 | 备注 | 证据 |
|---|---|---|---|---|
| 教师/教育工作者 | 行政任务与标准化内容生成可被自动化;核心教学和辅导具有韧性 | 角色转型可能;短期内岗位缩减不太可能 | ⚖ 有争议 | |
| 高级会计师/审计师 | 常规环节可自动化;复杂判断、客户关系、承担责任的工作具有韧性 | 两极分化:初级岗位被压缩,高级岗位被放大 | ◈ 有力证据 | |
| 市场营销专员 | 内容创作、A/B测试、营销分析正在快速自动化;创意策略受影响较小 | 当前为生产率放大器;初级岗位替代即将到来 | ◈ 有力证据 | |
| 人力资源 | 筛选、排程、行政事务已自动化;文化建设、冲突调解、需要判断力的工作尚未被替代 | 求职者追踪系统(ATS)已由AI驱动 | ◈ 有力证据 | |
| 卡车/快递司机 | 自动驾驶技术逐步接近可行性;但监管、保险、“最后一公里”延迟仍然存在 | 受影响劳动者数量庞大(仅美国即有350万);时间表屡次推迟 | ⚖ 有争议 |
| 职业 | 任务暴露度 | 为何具有韧性 | 风险等级 | 证据 |
|---|---|---|---|---|
| 管道工/电工/技术工种 | 需要在非结构化环境中执行精细手工操作;机器人尚无法可靠或经济地胜任 | 低——至少10至20年内 | ✓ 已证实 | |
| 注册护士 | 身体护理、患者沟通、情感劳动、非结构化临床判断 | 替代风险低;生产率增强潜力高(AI诊断辅助) | ✓ 已证实 | |
| 心理健康治疗师 | 治疗关系、共情能力、细微的人类判断力;AI工具作为补充而非替代 | 低——即使AI改善,监管与伦理壁垒仍然很高 | ◈ 有力证据 | |
| 学前教育工作者 | 身体照护、关系建立、发展监测——AI无法复制 | 极低 | ✓ 已证实 | |
| 高管/首席执行官 | 战略判断、关系资本、问责机制、在新情境中进行模糊决策 | 低——但采用AI的高管生产率将显著提升 | ◈ 有力证据 | |
| 建筑工人 | 在非结构化、多变环境中执行物理操作;机器人大规模应用尚不可行 | 10年以上风险较低;2030–2040年可能上升 | ✓ 已证实 |
总量数据掩盖了性别、年龄、教育和收入群体之间截然不同的境遇。同一个“AI创造更多就业”的标题,可以在总量层面成立,同时对特定人群而言意味着灾难。
结构性原因:2000至2019年间,美国秘书和行政助理岗位中有93%至97%由女性担任(美国人口普查局)。这些恰恰是AI替代的第一梯队职业。ILO发现,女性在文书和行政岗位中的过度集中是AI暴露性别差距的主要驱动因素——而非女性工作本身有什么天然更易被自动化的特性。
叠加效应:女性不仅集中于高风险岗位——她们采用AI工具的比例也更低,使其更难从“AI替代我”转向“AI赋能我”。研究表明,女性在使用AI工具时面临额外的社会压力(担心被认为“作弊”或能力不足),而男性则不会以同等程度面临此类压力。
偏见叠加:基于历史数据训练的AI系统会复制甚至放大招聘、薪酬决策和信用评分中的既有性别偏见——在失去的工作和申请的工作两端同时制造风险。ILO指出,女性在AI开发领域的代表性严重不足(据WEF 2025数据,全球AI从业者中女性仅占22%),这使得通过多元化开发团队实现自我纠正在结构上困难重重。
初级岗位压缩:最清晰且有据可查的年龄效应是初级岗位招聘的压缩。AI正在减少对初级劳动者的需求,而这些岗位传统上恰恰是职业发展阶梯的第一级台阶:初级开发者、初级分析师、初级律师助理、客服代表。通往高级岗位的管道在这些岗位本身受到威胁之前就已经收窄。
Z世代的悖论:对AI最焦虑的一代人,并非在总量上失去工作的一代——总体就业并未崩溃。他们所面对的是:通往职业阶梯的入口比前几代人更窄。即使宏观数据看起来正常,这也是实实在在的损害。
年长被替代劳动者:50岁以上因AI暴露岗位流失而失业的劳动者面临最严峻的转型挑战。波士顿联储的研究(2024年12月)发现,约21%的受访劳动者预计AI将在5年内恶化其财务状况,这一群体主要集中在年长队列中。在这一人生阶段,重新培训转入新行业更难、耗时更长且回报更低——布鲁金斯学会将这一群体认定为最脆弱的人群。
IMF工作论文(Rockall、Tavares、Pizzinelli,2025)区分了三类职业群体:HELC(高暴露、低互补——危险区)、HEHC(高暴露、高互补——赋能区)和LE(低暴露——基本不受影响)。关键政策问题在于哪些劳动者落在哪一区间。
低学历群体(无大学学位):对AI的即时暴露度较低(IMF数据:低收入国家劳动者26%,发达经济体60%),但向AI互补型岗位转型的能力也较弱。“不在AI经济的靶心”这种保护效应,部分源于尚未接入使风险与机遇并存的数字基础设施。
大学学历持有者:44%承认AI可以执行其部分任务(无大学学历者为22%)——认知度更高,但适应能力也更强。研究证实,拥有高等教育学历的劳动者更多将AI视为其能力的互补而非替代。
布鲁金斯学会确认:“收入更高、受教育程度更高的劳动者面临最多的暴露。”但如果互补性高,暴露并不意味着损害。真正的危险群体是那些学历足以处于AI暴露岗位,但缺乏资历、适应力或资源来转向互补角色的劳动者。
AI就业影响的阶层维度是这一议题中政治上最为敏感、分析上最具争议的方面。需要审慎区分同时运作的两种不同动态。
对AI替代担忧最常见的反驳是:新岗位会出现,正如历次技术变革中所发生的那样。在富裕国家,这一论点虽有争议但尚可成立。在发展中国家,论证则困难得多。
印度的悖论:印度立志成为重要的AI中心,其AI市场预计到2027年将以25%–35%的年复合增长率增长。然而,印度约2500亿美元的IT与商业服务行业——雇佣数百万从事英语外包认知型工作的劳动者——恰恰是最暴露于西方企业削减成本式AI自动化的行业。从印度AI雄心中获益的人群与因此失去工作的人群完全不同,二者在教育、语言、地理位置和收入上存在根本分隔。
数据标注陷阱:全球南方在AI领域的相当一部分“新岗位”由数据标注、内容审核和AI训练工作构成——在肯尼亚的时薪往往为1至2.5美元,在孟加拉国和印度也相仿。这些劳动者从事的是使AI系统得以运转的幕后苦工,缺乏最基本的保护,没有职业晋升通道,且暴露于造成心理伤害的内容之中。联合国贸易和发展会议(UNCTAD)曾警告,AI可能削弱发展中国家低成本劳动力的竞争优势——这是它们仅有的经济杠杆——且不会创造等价的替代机会。
IMF研究(2024)和ResearchGate分析(2025)证实:替代集中于2024至2027年,而岗位创造分布在更长的时间跨度上。在发达经济体,管理这一转型的制度、安全网和教育体系虽不完美但已存在。在经历外包岗位替代的发展中经济体,这些制度缓冲却付之阙如。结果是:发展中经济体经历替代却无对应的创造,国际不平等由此加剧。
在拉丁美洲:巴西、智利、哥伦比亚、墨西哥和秘鲁约25%的工作岗位表现出高AI暴露度但低任务互补性——使其极易被替代。ILO研究人员将呼叫中心和外包服务岗位劳动者面临的这一风险定性为“急迫的”。
劳动市场乐观主义最有力的论据是200年来技术创造就业多于其摧毁的证据。这一论据值得认真对待——也值得认真审视。
标准经济学反驳:“劳动总量固定谬误”——即认为可做的工作总量是固定的——确实是一个真正的逻辑错误。新技术创造新需求、新产业和我们无法提前预测的新职业。美联储理事巴尔(Barr,2025年5月)指出:经济学家长期以来对自动化导致永久性失业的假设持怀疑态度。
阿西莫格鲁的反击(麻省理工/IMF,2023年12月):“没有任何保证表明,在当前轨迹上,AI创造的就业将多于其摧毁的。”历史上新岗位创造的模式依赖于自动化与新任务创造之间的平衡。大约在1970年之后,这一平衡已经被打破。劳动收入份额已持续下降50年。新任务创造速度放缓,尤其是对没有四年制大学学位的劳动者而言。AI可能加速的是一个已经失衡的动态,而非扭转它。
速度论:历史上的转型耗时数代人。织布机替代织工经历了50至100年;劳动者的子女得以适应。AI可能将同等规模的转型压缩至5到10年。即使长期结果是净正面的,以人类生活衡量的转型成本——收入损失、心理困顿、家庭破裂——是真实的,且集中于特定人群,他们无法简单地“等待新岗位出现”。
“通用目的技术”(经济学意义上的GPT)指的是同时重塑多个行业的技术——电力、计算机、互联网。德明与萨默斯(2025)得出结论:AI足以被归入这一量级的通用目的技术。
AI与以往通用目的技术相比可能存在的根本差异:
1. 以往的通用目的技术自动化的是物理性或窄域认知任务。AI是首个能够执行通用推理、语言和创造性任务的技术——这些工作此前被视为人类独有且不可自动化的。2. 以往的通用目的技术创造了需要人类劳动来执行的新任务。而AI创造的新任务(AI训练师、AI伦理官、AI产品经理)相对于其替代的任务所需的劳动者数量要少得多。提示工程师——曾被预测将成为大规模职业——在LinkedIn招聘信息中的占比不到0.5%。3. 资本替代劳动的激励在美国税制中具有结构性基础(劳动税率约30%,资本税率约8%),使替代成为任何企业主体的理性选择。
“1993年,美国制造业中每千名工人拥有2.5台工业机器人。到2019年,这一数字升至20台。过度自动化导致劳动收入份额从1980年的64%降至2017年的57%。”
——阿西莫格鲁(Acemoglu)、马内拉(Manera)与雷斯特雷波(Restrepo),引自芝加哥布斯商学院评论AI正在提升暴露行业的生产率。这一点有充分证据支持,且并无严肃的质疑。关键的争议在于:生产率收益究竟转化为更广泛的繁荣,还是进一步集中于顶层。
生产率证据是真实的。随机对照实验——社会科学的金标准——证实AI工具确实提高了专业场景中的产出。问题不在于生产率是否提升,而在于谁获取了这一提升。
阿西莫格鲁与约翰逊(《权力与进步》,2023)提出了“生产率花车”概念:要使多数人从生产率增长中受益,生产率必须“锚定”于人类劳动效率的提升——即提高劳动者的边际生产率——而非仅仅自动化人类任务并将收益作为资本收入攫取。
美国经济政策研究所(EPI)的分析补充指出,美国劳动的有效税率约为资本的两倍,这意味着企业在结构上被激励以资本替代劳动,即使这并非最具经济效率的选择。布林约尔松(麻省理工)建议将劳动与资本的有效税率拉平,作为改变这一激励结构最直接的干预措施。
1990年代的反面证据:EPI的研究表明,1990年代——互联网带来的大规模技术驱动生产率增长时期——实现了广泛的工资增长和失业率下降,而非收益集中。原因在于:失业率被压低到足以使劳动者获得真正的议价权。政策教训是:宏观就业状况对生产率收益的分配方式的重要性,不亚于技术本身。
无论是灾难主义阵营还是轻视主义阵营,都制造了广泛传播但缺乏证据支持的论断。本节逐一辨析双方最常见的谬误。
弗雷与奥斯本(牛津马丁研究所,2013)构建了一个被高频引用的模型,预测美国47%的职业面临高风险。《哈佛数据科学评论》(2025年秋季)指出,这是一项任务层面的分析被错误地扩展到整个岗位层面。OECD采用其自身方法论进行的复制研究得出的比例为9%——低五倍。更关键的是:2013年被标记为“高风险”的职业(税务筹划员、电话推销员、保险核保员)在随后12年间事实上并未大规模消失。47%的数字在技术上是一个附有重大方法论限制条件的2013年模型输出——将其作为既定事实呈现即属虚假信息。
这一高盛数据(2023)被频繁误引。原始报告称,如果AI被广泛采用,3亿个全职工作当量可能暴露于自动化——这是乐观AI部署情景下的任务暴露估算。同一份报告预测,最可能的替代情景是美国6%–7%的劳动力受影响,失业率仅高出趋势水平0.5个百分点,并在约两年内恢复。3亿的数字是真实的;将其呈现为近期大规模失业预测则不属实。
Anthropic首席执行官达里奥·阿莫代在2025年声称,AI可能在五年内淘汰约50%的白领初级岗位。英伟达首席执行官黄仁勋(Jensen Huang)对此明确表示异议。证据显示,AI暴露行业的初级招聘确实在出现真实且有据可查的压缩——尤其是在科技行业。然而,“五年内跨所有行业50%的白领初级岗位”要求的采用速度和范围,是当前数据所无法证实的。其潜在的担忧是合理的;但具体数字和时间线缺乏充分证据支持。
历史模式是真实的:当今美国60%的工作岗位在1940年并不存在。但阿西莫格鲁与约翰逊指出,新任务创造自1970年以来已经放缓,自动化与岗位创造之间的平衡已经失调,而AI的采用速度可能将历来需要数代人完成的转型压缩至极短时间。过去的规律有效并不保证未来同样有效——尤其当AI是第一种威胁通用推理任务而非仅仅特定体力或窄域认知任务的技术时。“劳动总量固定谬误”是一个真正的经济学错误;仅凭援引它就全盘否定AI风险,同样是一种错误。
关于再培训项目的证据令人清醒。“中国冲击”研究(奥托尔(Autor)、多恩(Dorn)、汉森(Hanson),2016)——过去十年最具影响力的美国经济学论文——证明来自中国的进口竞争摧毁了美国大批劳动力,而再培训项目在促成成功转型方面基本失败。美国《劳动力创新与机会法》(WIOA)数据显示:截至2023–24年,不到10%的培训参与者获得了在岗培训,仅2%获得了学徒机会。成功的再培训案例是罕见的。在不解决成本、时间、心理困难和年龄歧视等结构性障碍的前提下,告诉55岁的被替代制造业或文职劳动者去“重新培训”,这不是政策——这是一种让最脆弱劳动者失望的安慰。
《哈佛数据科学评论》(2025年秋季)记录:提示工程师在LinkedIn近期招聘信息样本中的占比不到0.5%(Vu和Oppenlaender,2025)。2022至2023年间广泛流传的AI“新职业”预测(提示工程师、作为大规模雇主的AI伦理官)基本未按预期规模实现。这并不意味着AI不会催生新岗位——而是意味着关于具体哪些岗位将出现的预测系统性地不可靠,且净新增岗位的总量远比被替代的岗位更难预测。
对实际在推行的举措、每项干预措施的证据评估,以及潜在颠覆规模与政策应对规模之间结构性差距的全景梳理。
结构性问题需要结构性解决方案。但在等待政策的同时,个人可以采取有证据支持的行动。按人生阶段和行业分类呈现。
如果你的职业出现在第03节的“极高风险”或“高风险”表格中——或者你的岗位以行政、数据录入或常规客户服务为主。
如果你的职业属于“韧性”类别——技术工种、医疗卫生、教育、复杂专业服务。
本报告中的所有事实性论断均标注了具体、可核实的出版物来源。预测与实证研究全文明确区分。