发米下载:值得大家信赖的游戏下载站!

所在位置: > 区块链 > OpenAI 数据显示,AI 尚未取代你的工作,但可能很快就会取代你

OpenAI 数据显示,AI 尚未取代你的工作,但可能很快就会取代你

发布时间:2025-09-27 00:00:39来源:发米下载作者:zhoucl

本站报道:

OpenAI 揭幕GDP值周四,这项基准测试试图定性地评估人工智能是否能够完成你的实际工作。

这些并非假设性的考试题目,而是真实的可交付成果:法律摘要、工程蓝图、护理计划、财务报告——这类工作可以用来偿还抵押贷款。研究人员特意关注那些至少60%的任务基于计算机的职业——他们将这些职位描述为“以数字化为主”。

这一范围涵盖软件开发人员、律师、会计师和项目经理等专业服务;分析师和客服代表等金融和保险职位;以及从记者、编辑到制作人和视听技术人员等信息行业职位。医疗保健管理、白领制造业职位以及销售或房地产经理也占据了显著位置。

在这一集合中,最容易受到人工智能影响的工作与大型语言模型已经能够很好地处理的数字化、知识密集型活动重叠:

  • 软件开发是数据集中最大的工资来源,尤其容易受到攻击。
  • 法律和会计工作严重依赖文件和结构化推理,因此也名列前茅,财务分析师和客户服务代表也是如此。
  • 鉴于人工智能在语言和多媒体生成方面日益流畅的能力,内容制作角色(编辑、记者和其他媒体工作者)面临着类似的压力。

该研究未纳入体力劳动岗位,凸显了其局限性:GDPval 的设计初衷并非衡量建筑、维护或农业等领域的受自动化影响程度。相反,它强调了第一波颠覆浪潮可能冲击白领和办公室工作——而这些工作曾被认为最不受自动化影响。

该报告基于两年前 OpenAI/宾夕法尼亚大学一项研究声称高达80%的美国劳动者可能会发现至少10%的工作内容会受到法学硕士(LLM)的影响,约19%的劳动者可能会发现至少50%的工作内容会受到影响。受影响最严重(或发生转变)的工作是白领、知识型工作,尤其是在法律、写作、分析和客户互动领域。

但令人不安的不是今天的数字,而是未来的发展轨迹。按照这样的速度,统计数据建议人工智能可以全面匹敌人类专家到2027年。这非常接近 AGI 标准,并且可能意味着即使被认为不安全或过于专业而无法自动化的任务也可能很快会被机器所掌握,从而威胁到工作场所的快速转型。

OpenAI 测试了 44 个职业的 1320 项任务——这些工作并非随机的,而是构成美国 GDP 支柱的九大行业。软件开发人员、律师、护士、金融分析师、记者、工程师:这些人原本以为自己的学位可以保护自己免受自动化的侵害。

每项任务都出自平均拥有 14 年经验的专业人士——他们并非实习生或应届毕业生,而是经验丰富的专家。这些任务也并不简单,平均需要 7 个小时,有些甚至需要数周时间才能完成。

OpenAI 表示,在一些特定 API 任务中,模型完成这些任务的速度比人类快 100 倍,而且成本明显更低——这是意料之中的,而且几十年来一直如此。在更专业的任务上,改进速度较慢,但仍然显著。

即使考虑到审查时间和人工智能产生奇怪幻觉时偶尔需要重做的情况,经济学仍然倾向于自动化。

但别灰心:一项工作被曝光并不意味着它会消失。它可能会被增强(例如,律师和记者利用法学硕士学位来提高写作速度),而不是被取代。

就人工智能的发展而言,幻觉仍然是企业的痛点。研究表明,人工智能在遵循指令方面最常失败——GPT-5 35% 的失败源于未能完全理解指令。格式错误则导致另外 40% 的失败。

这些模型在协作、客户互动以及任何需要真正问责的事情上也表现不佳,而 OpenAI 的研究并未涵盖这些方面。目前还没有人起诉人工智能存在渎职行为。但就单一的数字交付成果而言——占据大多数知识工作者日常工作的报告、演示文稿和分析——两者之间的差距正在迅速缩小。

OpenAI 承认,GDPval 目前涵盖的人们在实际工作中执行的任务数量非常有限。该基准无法衡量人际交往能力、个人表现,也无法衡量那些使一个人的价值超越其交付成果的数千个细微决策。

然而,当投资银行开始比较人工智能生成的竞争对手分析与人类分析师的分析相比,医院评价人工智能护理计划与经验丰富的护士的护理计划以及律师事务所测试人工智能针对助理工作进行简报——这不再是猜测,而是衡量。

  • 热门资讯
  • 最新资讯